دانلود پایان نامه ارشد درباره تحلیل داده، رگرسیون، انحراف معیار، رگرسیون خطی

دانلود پایان نامه ارشد

از روش ها و ابزار مورداستفاده در تجزیه و تحلیل داده ها مشتمل بر روش های آماری و غیر آماری، مدل تحقیق و اجزای آن در قالب یک مدل منطقی ریاضی برای تعیین متغیرها، اندازه گیری و بیان نوع رابطه بین آن ها و برآورد این رابطه و در نهایت نرم افزارهای مورد استفاده در این زمینه به همراه موارد استفاده از هریک مورد بحث قرار گرفته اند.
3-2) روش کلی تحقیق:
نوع يا روش کلی این تحقیق را میتوان مبتني بر چهار معيار اساسي طبقه بندي تحقيقات مشتمل بر هدف، روش گردآوري داده ها و استنتاج، طرح تحقيق و نهايتا نوع و ماهيت داده ها و متغيرها و روش هاي تعيين ارتباط بين متغيرها به شرح ذیل مشخص کرد:
1) از جهت هدف: این تحقیق به دنبال طرح نظریه الگو یا ابزار جدید نبوده بلکه به دنبال به کارگیری روش‌ها و مدل‌های موجود در قلمرو تحقیق در راستای بهبود وضعیت میباشد بدین لحاظ میتوان این تحقیق را از نوع تحقیقات “کاربردی” نامید.
2) از نظر روش استنتاج: از آن جهت كه در انجام اين تحقيق از نمونه تصادفي استفاده شده است، مبتني بر روش گردآوري داده ها و استنتاج، در اين تحقيق جهت تبيين مشاهدات نمونه اي از روش “توصيفي” و در تعميم يافته ها از جمله در تحليل پيش فرض ها و تعميم پارامترهاي رگرسيوني از نمونه به جامعه آماري از روش تحليلي يا “استقرايي” استفاده شده است.
3) طرح تحقیق: با عنایت به اینکه دادههای آماری مورد استفاده در این تحقیق دادهای عملکردی مربوط به يك بازه زماني 5 ساله مالي منتهي به 29/12/1392 بوده و به طور کلی بازه زمانی گذشته میباشد طرح تحقیق از نوع “پس رویدادی”، گذشته نگر یا توصیفی- تحلیلی مبتنی بر تجربیات گذشته یا Ex-post facto بوده است.
4) ماهيت داده ها و روش ها: به جهت كمي بودن داده هاي عملكردي مورد استفاده در تحليل، ماهيت كمي متغيرها و روش هاي مورد استفاده در تعيين ارتباط بين متغيرها، تحقيق حاضر از تحقيقات كمي و “غيرقضاوتي” بوده است.
3-3) جامعه آماری
جامعه آماري اين تحقیق ، شرکت های پذيرفته شده در بورس اوراق بهادار تهران در يك بازه زماني 5 ساله طي سال هاي مالي 1392-1388 است که از شرايط زير به جهت فراهم آمدن امكان مقايسه بين آن ها، برخوردار باشند :
1) قبل از بازه زمانی سال هاي مالي 1392-1388 وارد بورس شده و طی دوره مزبور از بورس خارج نشده باشند.
2) اطلاعات سالانه آنها در پایان هر سال منتشر شده و یا بر مبنای مستندات موجود قابل دسترسی باشد .
3) سال مالی شرکت ها طی کل دوره قلمرو زمانی تحقیق به 29 اسفند ختم شوند و در طی بازه زمانی تحت بررسی، سال مالی خود را تغییر نداده باشند.
4) نوع فعالیت شرکتها تولیدی يا بازرگاني بوده به تعبيري، متعلق به مجموعه بانك ها، موسسات مالی، اعتباری و سرمایه گذاری نباشد.
بر مبناي شرايط فوق الذكر تعداد شركت هاي مورد مطالعه يا حجم جامعه آماري(N) به عنوان جامعه آماري 245 شركت بوده اند.
3-4)حجم نمونه و کفایت آن
تعیین حجم نمونه اهمیت فراوانی در قابلیت تعمیم نتایج آزمون به جامعه دارد . روش های مختلفی جهت تعیین حجم نمونه وجود دارد که دقیق ترین روش ها ، روش های ریاضی جهت محاسبه حجم نمونه است . (مومنی ،1386، 17ص217).
جهت تعيين حجم نمونه در اين تحقیق به ترتيب زيرعمل شده است:
الف) تعیین نمونه پایلوت:
برای داشتن برآوردی از واریانس جامعه نمونه ای پایلوت به حجم 15 شرکت به روش تصادفی ساده انتخاب گردید.
ب) برآورد واریانس متغیر وابسته: در نمونه تصادفی پایلوت واریانس نمونه ای از متغیر وابسته تحقیق یا حجم مبادلات به عنوان برآوردی از واریانس اصلي در جامعه آماری طبق فرمول زير محاسبه شد.

بر محبناي محاسبات انجام شده واريانس نمونه اي برابر 865231 به دست آمد.
ج) محاسبه حجم نمونه اصلی: برای تعیین حجم نهایی نمونه تصادفی از فرمول زیر با عنایت به مجهول بودن واریانس جامعه و استفاده از واریانس نمونه ای به عنوان برآورد آن، تعیین شده است:

که در این فرمول n حجم نمونه nتصادفی نهایی، t مقدار تابع توزیع تی استیودنت، S انحراف معیار نمونه ای و مجذور آن واریانس نمونه ای محاسبه شده در بند ب می باشد. α احتمال خطای نوع اول که معمولا در علوم اجتماعی 5 درصد تعیین می گزدد، df درجه آزادی که در اینجا حجم نمونه تصادفی پایلوت منهای یک است، D خطای نوع دوم یا درصد خطای مجاز در مورد متغیرهای نسبی است که در تحقیقات گذشته بین 1 تا 5 درصد واريانس در نمونه برآوردي آزمايشي فرض شده كه در اینجا 20335 انتخاب شده است. با جای گذاری مقادیر در این فرمول محاسبات حجم نهایی نمونه به صورت زیر درآمده است:
n ≥ (1.76132*1.76132*865231)/ 20335 = 112.9971115
که با گرد کردن آن حجم نمونه تصادفی نهایی 113 محاسبه شده است. با عنایت به محدود شدن حجم نمونه تصادفی در هر گروه و نیاز به استفاده از روش رگرسیون خطی مرکب، داده ها در یک بازه زمانی 5 ساله در فاصله زمانی بین 1388 تا 1392 مورد مطالعه قرار گرفته اند. بنابراین نمونه نهایی مشتمل بر 5 نمونه وابسته یا به عبارتی 565 سال- شرکت بوده است.

3-5)روش نمونه گيري و دليل استفاده از آن
به جهت عدم استفاده از متغيرهاي كنترلي در تحقيق، روش نمونه گيري در اين تحقيق، روش تصادفي ساده بوده است. بدين منظور جامعه آماري به شرح تعريف شده در بند 3-3 با اعدا 1 تا 265 كد گذاري شده و با استفاده از شبيه سازي كامپيوتري در اين بازه، 132 عدد انتخاب گرديد. در انتها بر اساس فهرست كدگذاري شركت ها، شركت هاي متناظر با كدهاي انتخاب شده به عنوان نمونه تصادفي آماري انتخاب و داده هاي خام عملكردي در ارتباط با آن ها گردآوري شد.
3-6)روش های گردآوری داده ها و کاربرد آن
1) روش مطالعه کتابخانه ای : از این روش برای تبیین مبانی نظری تحقیق و گردآوری پیشینه تحقیق استفاده شده است. در این راستا کتابها ، پایان نامه ها ، و مقاله های فارسی و انگلیسی مورد بررسی و استفاده قرار گرفته است .
2) روش مطالعه اسناد و مدارک : به منظور دستیابی به داده های مورد نیاز برای پردازش فرضیه های تحقیق ، از روش مطالعه اسناد و مدارک با توجه به اطلاعات ارائه شده شرکت ها استفاده شده است . در این راستا ، صورتهای مالی و یادداشتهای توضیحی شرکت ها مورد استفاده قرار گرفته است .
3) کاوش اینترنتی : برای تبیین بخشی از مبانی نظری تحقیق و گردآوری پیشینه تحقیق و در واقع تکمیل ادبیات تحقیق در کنار روش مطالعه کتابخانه ای مورد استفاده قرار گرفته است .

3-7)ابزار گردآوری داده ها و کاربرد آن:
در این تحقیق جهت گردآوری داده های مربوط به تبیین ادبیات تحقیق و اجرای تحقیق در قلمرو مکانی تحقیق، بسته به مورد از ابزار زیر استفاده شده است:
الف) فیش : برای ثبت و ضبط مطالب به دست آمده در بررسی اسناد و مدارک در مطالعات کتابخانه ای که اعتبار و پایایی خود را در سطح بالایی حفظ می کند ، استفاده شده است.
ب) جدول : جهت تلخیص داده ها با استفاده از اطلاعات شرکتها و با توجه به اسناد و مدارک ارائه شده توسط آنها به سازمان بورس اوراق بهادار تهران از جداول تلخیص داده ها استفاده شده است.
8-3) پایایی و اعتبار ابزار تحقیق:
پایایایی به معنای تکرار پذیری نتایج و اعتبار یا دقت به معنای این است که آیا آن چه را که می خواسته ایم به درستی اندازه گرفته ایم یاخیر. در راستای افزایش پایایی و اعتبار داده های گردآوری شده بسته به مورد از روش های ذیل استفاده شده است:
الف ) پایایی ابزار تحقیق : پایایی یعنی تکرار پذیری نتایج اندازه گیری . یعنی اگر اندازه گیری تکرار شود همان نتایج قبلی بدست آید . به طور کلی اگر مبدا زمانی یک متغیر، تغییر کند و میانگین و واریانس و کواریانس آن تغییری نکند، در آن صورت متغیر پایاست و در غیر این صورت متغیر، ناپایا خواهد بود. در پژوهش حاضر برای تشخیص پایایی از آزمون ADF فیشر استفاده شده است .
ب ) اعتبار ابزار تحقیق : برای تعیین اعتبار محتوایی ، در تحقیقات پس رویدادی از منابع یا مدارک ممیزی شده و نیز استفاده از منابع موازی که همدیگر را تائید کنند استفاده می شود ، که این کار دقت و اعتبار را بالا می برد . در این تحقیق هم برای تعیین اعتبار به مطالعه و بررسی صورت های مالی و یادداشت های پیوست صورت های مالی شرکتهای بورسی استناد شده است .
3-9)روش ها و ابزار تجزیه وتحلیل داده ها:
در این تحقیق جهت تجزیه و تحلیل داده ها به ترتیب از ابزار و روش های زیر استفاده شده است:
یک) روشهای آماری:
که در چهار دسته روش های توصیفی، روش های تحلیل پیش فرض ها ، روش های تعیین ارتباط بین متغیرها و نهایتا روش های تعمیم یافته ها از نمونه به جامعه آماری تقسیم می شوند.
الف) روشهای توصیفی :
که در این تحقیق از جدول توزیع فراوانی ، نمودار میله ای و هیستوگرام ، نمودار پراکندگی ، شاخص های آماری میانگین ، انحراف معیار ، حداقل و حداکثر ، ضرایب چولگی و کشیدگی استاندارد برای توصیف نمونه آماری و توصیف داده ها استفاده شده است.
ب) روش های تحلیل پیش فرض ها :
از آنجا که به تبعیت از تحقیقات مشابه و مرتبط در این تحقیق نیز از رگرسیون خطی مرکب استفاده شده و در این تحلیل رگرسیونی از داده های عملکردی سال های (1389-1393) به عنوان یک بازه زمانی 5 ساله و در نتیجه به روش داده های تابلویی استفاده شده است،پیش فرض های این روش به شرح زیر ارزیابی شده است :
1) ارزیابی نرمال بودن توزیع متغیرها: از این روش برای ارزیابی نرمال بودن توزیع متغیرهای وابسته و مستقل تحقیق استفاده شده و آزمون مورد استفاده با آماره کولموگروف- اسمیرونوف بوده و در مواردی که فرض نرمال بودن برقرار نبوده از تبدیل لگاریتم مجذورات متغیر بهره گرفته شده است.
2) ارزیابی نرمال بودن توزیع باقی مانده ها: در این راستا از مقایسه پارامترهای خطاها با منحنی متناظر نرمال استاندارد استفاده شده است. تقریبا صفر بودن میانگین و یک بودن انحراف معیار توزیع خطاها حاکی از انطباق توزیع خطاها بر توزیع نرمال تلقی شده است.
3) آزمون ثبات واریانس ها: در این زمینه از آزمون وایت با فرض صفر همسانی یا برابری واریانس ها و نمودار پراکندگی استفاده شده است
4) استقلال خطی متغییرهای مستقل: به منظور ارزیابی استقلال خطی متغیرهای مستقل و به تعبیری برقراری فرض جمع پذیری از تحلیل همبستگی خطی پیرسون استفاده شده است که در آن به صفر میل کردن ضرایب همبستگی حاکی از قابل اغماض بودن تاثیرات متقابل متغیرها و به تعبیری استقلال خطی متغیرهای مستقل بوده است.
5) همسان سازی داده ها: در مواردی که داده های مربوط به یک متغیر به صورت مطلق و بر مبنای ارزش ریالی تعریف شده بود، به منظور فراهم کردن قابلیت مقایسه ارزش های متعلق به زمان ها یا تلفیق داده های مربوط به سال های مختلف عملکردی از تعدیل داده ها به روش لگاریتمی یا در صورت امکان از تعدیل بر مبنای شاخص عمومی قیمت ها استفاده شده است.
6) استقلال باقی مانده ها: به منظور ارزیابی استقلال باقی مانده ها یا خطاهای در برآورد رابطه خطی مرکب بین متغیرهای وابسته و مستقل از آماره دوربین واتسون بهره گرفته شده است. ملاک استقلال خطاها قرار گرفتن این آماره در فاصله بین 1.5 تا 2.5 می باشد.
7) تعیین نوع تحلیل تابلویی: به منظور انتخاب از بین روش های ثابت یا غیر ثابت و اثرات تصادفی یا غیر تصادفی از آزمون های چاو و هاسمن استفاده شده است .
ج) روش های تعیین ارتباط بین متغیر ها:
پس از ارزیابی پیش فرض ها به شرح بند قبل، و در صورتی که این پیش فرض ها برقرار نبوده استفاده از روش های نرمال سازی، از رگرسیون خطی مرکب به روش ترکیبی یا تحلیل داده های تابلویی استفاده شده است. ضمنا به منظور اعتبارسنجی استفاده از این روش از تفسیر ضریب تعیین بهره گرفته شده که به یک میل کردن آن حاکی از قوی بودن رابطه خطی بین متغیرها بوده است.
د) روش های تعمیم نتایج:
با توجه به اینکه از نمونه گیری تصادفی استفاده خواهد شد برای تعمیم نتایج

پایان نامه
Previous Entries دانلود پایان نامه ارشد درباره بورس اوراق بهادار، بورس اوراق بهادار تهران، اعلان سود، اخبار خوب Next Entries دانلود پایان نامه ارشد درباره سود پیش بینی شده، اعلان سود، رگرسیون، اندازه شركت