دانلود پایان نامه ارشد درباره مدل رگرسیون، اثرات ثابت، سطح معنادار

دانلود پایان نامه ارشد

آن محاسبات آماری خاص است و یک بعد کیفی، که آن تحلیلها، استدلالها، و استنتاجهایی است که بر نتایج محاسبات آماری صورت میپذیرد تا بتوان در نهایت آن را به جامعۀ آماری تعمیم داد (همان منبع).
در این پژوهش به منظور تجزیه و تحلیل دادهها و انجام آزمون فرضیههای تحقیق از روش تحلیل رگرسیون (با استفاده از تکنیک پنل دیتا) استفاده شده است. لذا بدین منظور در این تحقیق پس از اجرای مرحله تحقیق کتابخانهای و میدانی و استخراج اطّلاعات کافی از نمونهها و محاسبه ارزشهای هریک از متغیرها با استفاده از نرم افزارهایExcel ، با استفاده از نرم افزارهای SPSS21، EViews8 (برای آزمون پنل دیتا) و Stata11 (به منظور انجام آزمون ناهمسانی واریانسها و آزمون خود همبستگی) به تجزیه و تحلیل یافتهها و آزمون فرضیهها پرداخته شده است.
در ادامه فصل مفروضات مدل رگرسیون خطی که برای انجام آزمونها مورد نیاز است و نیز توضیحات مختصری در مورد دادههای پنلی و مزایای بکارگیری آنها و نیز روشهای مورد استفاده جهت آزمون دادههای پنلی، تشریح خواهد شد.
3-8- مفروضات مدل رگرسیون خطی
3-8-1- فرض عدم همخطی
همخطی وضعیتی است که نشان میدهد یک متغیر مستقل تابعی خطی از سایر متغیرهای مستقل است. اگر همخطی در یک معادله رگرسیون بالا باشد، بدین معنی است که بین متغیرهای مستقل همبستگی بالایی وجود دارد و ممکن است R-Square مدل دارای اعتبار بالایی نباشد. به عبارتی دیگر، با وجود آن که مدل خوب به نظر میرسد، ولی دارای متغیرهای مستقل معنیداری نمیباشد. در این پژوهش برای بررسی همخطی بین متغیرهای مستقل از آزمون همبستگی بین متغیرهای مستقل استفاده میشود. برای پذیرش عدم همخطی بین متغیرهای مستقل، باید همبستگی شدیدی بین متغیرهای مستقل (بالای 7/0) وجود نداشته باشد.

3-8-2- فرض همسانی واریانسها
فرض میشود که واریانس خطاها مقدار ثابتی است که معمولاً با δ^2 نشان داده میشود. این فرض به همسانی واریانسها معروف است. اگر خطاها، واریانس ثابت نداشته باشند، گفته میشود آنها ناهمسان هستند. در این پژوهش برای تشخیص ناهمسانی واریانسها از نرم افزار Stata و آزمون LR49 استفاده میشود. در این آزمون فرض صفر مبتنی بر همسانی واریانسها و فرض یک مبتنی بر ناهمسانی واریانسها است. اگر آماره آزمون از مقدار بحرانی (5%) کوچکتر باشد، فرض صفر مبنی بر همسانی واریانسها رد خواهد شد، به عبارت دیگر در این حالت ناهمسانی واریانسها وجود خواهد داشت.
H0: همسانی واریانسها
H1: ناهمسانی واریانسها
3-8-3- فرض عدم وجود خود همبستگی
در مدلهای رگرسیون فرض بر آن است که جملات خطا از دورهای به دوره بعد مستقل میباشند، اما در بسیاری از موارد، جملات خطا در دورههای مختلف همبستهاند. در چنین مواردی جملات خطا اصطلاحاً دارای خود همبستگی یا همبستگی سریالی هستند. برای بررسی آن که در یک مدل رگرسیون، جملات خطا خود همبسته میباشند یا خیر، از نرم افزار Stata و آزمون 50LM استفاده میشود. اگر آماره آزمون از مقدار بحرانی (5%) کوچکتر باشد، فرضیه صفر مبنی بر عدم وجود خود همبستگی رد میشود. بنابراین در این حالت خود همبستگی وجود دارد.
H0: عدم وجود خود همبستگی
H1: وجود خود همبستگی
لازم به ذکر است که چنانچه خود همبستگی بین متغیرها مورد تأیید قرار گرفت، جهت رفع خود همبستگی بین متغیرها، اگر مدل اثرات ثابت انتخاب شود، از پارامتر AR1 استفاده میشود؛ و چنانچه مدل اثرات تصادفی انتخاب شود، از روش تصادفی با در نظر گرفتن AR1 برای رفع خود همبستگی بین متغیرها استفاده میشود.

3-9- تعریف دادههای پنلی
قبل از پرداختن به روشهای آماری مورد استفاده جهت آزمون فرضیهها ابتدا لازم است توضیحی در خصوص دادههای پنلی و مزایای آنها ارائه شود:
دادههای پنلی51 به مجموعهای از دادهها گفته میشود که بر اساس آن مشاهدات به وسیله تعداد زیادی از متغیرهای مقطعی (N) که اغلب به صورت تصادفی انتخاب میشوند، در طول یک دوره زمانی مشخص(T) مورد بررسی قرار گرفته باشند، (N*T) دادۀ آماری را دادههای پنلی یا دادههای مقطعی- سری زمانی مینامند. به این دلیل که دادههای پنلی در برگیرنده هر دو جنبه دادههای مقطعی و سری زمانی میباشند، بکارگیری مدلهای توضیح دهنده آماری مناسبی که ویژگیهای آن متغیرها را توصیف کند، پیچیدهتر از مدلهای استفاده شده در دادههای مقطعی و سری زمانی است.
3-10- مزایای دادههای پنلی
دادههای پنلی دارای مزایای فراوانی نسبت به دادههای مقطعی یا سری زمانی هستند که برخی از مهمترین آنها عبارتند از:
دادههای مقطعی و سری زمانی صرف، ناهمسانیهای فردی را لحاظ نمیکنند، لذا ممکن است که تخمین تورشداری به دست دهند، در حالی که در روش پنل میتوان با لحاظ کردن متغیرهای مخصوص انفرادی52 این ناهمسانیها را لحاظ کرد.
دادههای تابلویی دارای اطّلاعات بیشتر، تغییرپذیری بیشتر، همخطی کمتر، درجه آزادی بالاتر و کارایی بالاتر نسبت به سری زمانی و دادههای مقطعی میباشند. به خصوص اینکه یکی از روشهای کاهش همخطی، ترکیب دادههای مقطعی و زمانی به صورت دادههای تابلویی میباشد.
با مجموعه دادههای تابلویی، میتوان اثراتی را شناسایی و اندازهگیری کرد که در دادههای مقطعی محض یا سری زمانی خالص قابل شناسائی نیست. گاهی استدلال میشود دادههای مقطعی، رفتارهای بلندمدت را نشان میدهند، در حالی که در دادههای سری زمانی بر اثرات کوتاهمدت تأکید میشود. با ترکیب این دو خصوصیت در دادههای تابلویی، که خصوصیت متمایز پنل دیتاست، ساختار عمومیتر و پویاتری را میتوان تصریح و برآورد کرد (مهرگان و اشرف زاده، ۱۳۸۷، 41).
دادههای تابلویی که بر حسب بنگاهها، خانوارها و افراد جمعآوری میشوند، ممکن است دقیقتر از دادههای مشابه اندازهگیری شده در سطح کلان باشند. بنابراین، تورشی که ممکن است در دادههای کلان حاصل شود، در دادههای تابلویی حداقل میگردد (بالتاجی، 2005، 4).
دادههای پنلی از طریق فراهم کردن تعداد دادههای زیاد، تورش را پائین میآورد (گجراتی، 2004، 638).
مطالعه مشاهدات به صورت دادههای پنلی، وضعیت بهتری برای مطالعه و بررسی پویایی تغییرات نسبت به سری زمانی و مقطعی داراست.
3-11- روشهای آماری مورد استفاده جهت آزمون دادههای پنلی در EViews
3-11-1- آزمون پایایی در دادههای تابلویی
اغلب مدلهای اقتصادسنجی که در دهههای قبل مورد استفاده قرار میگرفت، بر فرض پایایی سریهای زمانی استوار بود. بعداً که ناپایایی اکثر سریهای زمانی مشخص شد، بکارگیری متغیرها منوط به انجام آزمونهای پایایی مربوطه گردید. به چند دلیل بررسی پایایی سری دادهها مهم است. پایایی یا ناپایایی یک سری میتواند تأثیر شدیدی روی رفتار و ویژگیهای آن داشته باشد. اگر متغیرها ناپایا باشند، در عین حال که ممکن است هیچ رابطه مفهومی بین متغیرهای مدل وجود نداشته باشد، ضریب تعیین بدست آمده آن میتواند بسیار بالا باشد و موجب شود تا محقق استنباطهای نادرستی در خصوص ارتباط بین متغیرها انجام دهد. همچنین وجود متغیرهای ناپایا در مدل سبب میشود تا آزمونهای t و F نیز از اعتبار لازم برخوردار نباشند و در نهایت رگرسیون بدست آمده رگرسیون کاذب باشد (نوفرستی، 1378). در این پژوهش پایایی تک تک متغیرها از طریق آزمون ریشه واحد لوین، لین و چو53 (LLC) مورد بررسی قرار میگیرد.
3-11-1-1- آزمون ریشه واحد لوین، لین و چو (LLC)
آزمون ریشه واحد سریهای زمانی به گونهای است که پایایی یا عدم پایایی متغیرها را با استفاده از یک معادله بررسی میکند. لوین لین چو نشان داد که در دادههای تابلویی، استفاده از آزمون ریشه واحد برای ترکیب دادهها ، دارای قدرت بیشتری نسبت به استفاده از آزمون ریشه واحد برای هر مقطع به صورت جداگانه است.
وی آزمون ریشه واحد ثابت برای هر مقطع را به صورت رابطه (3-13) ارائه کرده است:
ΔXi,t= ρixi,t-1+ δt+ αi+ εi,t (3-13)
که در آن N تعداد مقطعها، T دوره زمانی، Pi پارامتر خود همبسته برای هر مقطع، δاثر زمان ، αi ضریب ثابت برای هر مقطع و itε خطای مدل که دارای توزیع نرمال با میانگین صفر و واریانس δ^2 است.
این آزمون بر اساس آزمون دیکی فولر تعمیم یافته54 به صورت رابطه (3-14) در نظر گرفته شده است:
ΔXi,t= ρixi,t-1+δt +αi + ∑_(j=1)^Li▒θij Δxi,t-j +εi,t (3-14)
در رابطه (3-14)، iρ پارامتر خود همبسته برای هر مقطع، Li طول وقفه، δ اثر زمان، iα ضریب ثابت برای هر مقطع و i,tε خطای مدل که دارای توزیع نرمال با میانگین صفر و واریانس δ^2 است.
آزمون LLC، آزمون ترکیبی ADF با روند زمانی است که در صورت وجود ناهمگنی مقطعها و ناهمسانی واریانس جملات خطا، دارای قدرت بالایی است.
فرضیههای این آزمون به صورت زیر است:
H0: عدم وجود پایایی
H1: وجود پایایی
اگر آماره آزمون از مقدار بحرانی جدول (5%) بیشتر بود، فرضیه صفر مبنی بر عدم وجود پایایی رد میشود. حال اگر تمام متغیرها پایا بودند، بلافاصله باید آزمون F لیمر برای تعیین تلفیقی (Panel) یا ترکیبی (Pooled) بودن انجام گیرد. ولی چنانچه حتی یکی از متغیرها پایا نباشد، باید آزمون همجمعی یا پایایی بلندمدت را برای آن دسته از فرضیههایی که متغیرهای ناپایا در آن فرضیهها قرار دارند، انجام داد.
3-11-2- انتخاب نوع مدل از طریق آزمون F لیمر
پس از تأیید پایایی متغیرهای پژوهش، اقدام به انتخاب نوع مدل از طریق آزمون F لیمر مینماییم. در واقع آزمون F لیمر مشخص میکند که مدل مورد استفاده تلفیقی (Panel) است یا ترکیبی (Pooled). چنانچه آماره Cross-Section F کمتر از 5% سطح معناداری باشد، نوع مدل انتخابی تلفیقی (Panel) و چنانچه بیشتر از 5% سطح معناداری باشد، نوع مدل انتخابی ترکیبی (Pooled) خواهد بود. چنانچه مدل ترکیبی انتخاب گردد، کار تمام است و با آن ادامه میدهیم ولی چنانچه مدل تلفیقی انتخاب گردد، در مرحلهی بعد باید از طریق آزمون هاسمن، الگوی مناسب یعنی اثرات ثابت (FEM55) یا اثرات تصادفی (REM56) انتخاب شود.

3-11-3- آزمون هاسمن برای انتخاب اثرات ثابت یا تصادفی
رایجترین آزمون برای تعیین نوع مدل دادههای تلفیقی آزمون هاسمن57 است (یافّه، 2003). آزمون هاسمن بر پایه وجود یا عدم وجود ارتباط بین خطای رگرسیون تخمین زده شده و متغیرهای مستقل مدل استوار است. اگر این ارتباط وجود داشت، مدل اثر تصادفی و اگر این ارتباط وجود نداشت، مدل اثر ثابت کاربرد خواهد داشت. فرضیه H0 نشان دهنده عدم ارتباط بین متغیرهای مستقل و خطای تخمین و فرضیه H1 نشان دهنده وجود ارتباط است. چنانچه آماره Cross- Section Random کمتر از 5% سطح معناداری باشد، الگوی اثرات ثابت (FEM) و چنانچه بیشتر از 5% سطح معناداری باشد، الگوی اثرات تصادفی (REM) انتخاب میگردد.
3-12- خلاصۀ فصل
در این فصل، روش تحقیق مورد استفاده در پژوهش تشریح شد. جامعۀ آماری، روش نمونهگیری و حجم نمونه و نیز قلمرو پژوهش که شامل قلمرو موضوعی، قلمرو مکانی و قلمرو زمانی میباشد، بیان شد. سپس مبانی مختلف سنجش متغیرهای مستقل و وابسته و نحوه استخراج و اندازهگیری آنها و نیز روش گردآوری اطّلاعات که در این تحقیق مورد استفاده قرار گرفته، ارائه شد. در نهایت اینکه توضیحاتی در مورد مفروضات مدل رگرسیون خطی و تعریف و مزایای بکارگیری دادههای پنلی و آزمونهای آماری مورد استفاده جهت آزمون دادههای پنلی ارائه شد.

فصل چهارم
تجزیه و تحلیل دادهها

4-1- مقدمه
تجزیه و تحلیل اطّلاعات، اجرای فرآیندی است که طی آن دادهها جمعآوری، تلخیص، گروهبندی و در نهایت پردازش میشوند. این فصل به ارائه تجزیه و تحلیل یافته‌های پژوهش اختصاص دارد. پژوهشگر پس از اينكه روش پژوهش خود را مشخص كرد و با استفاده از ابزارهاي مناسب، دادههاي مورد نياز را براي آزمون فرضيههاي خود جمعآوري كرده، اكنون نوبت آن است كه با بهرهگيري از تكنيكهاي آماري

پایان نامه
Previous Entries پایان نامه درباره حقوق انسان Next Entries دانلود پایان نامه ارشد درباره سرمایه فکری، بورس اوراق بهادار، شرکتهای تولیدی پذیرفته شده در بورس