پایان نامه با کلمات کلیدی اثرات ثابت، رگرسیون، انحراف معیار، آزمون فرضیه

دانلود پایان نامه ارشد

که تمامی آزمونهای آماری در سطح معناداری 95% انجام گرفته است.

3-7 روشهای آماری آزمون فرضیهها
3-7-1 آمار توصیفی
شاخص های مرکزی و پراکندگی برای متغیرهای تحقیق بمنظور تحلیل توصیفی متغیرها قبل از آزمون فرضیهها تعیین میشوند. میانگین به عنوان مهمترین شاخص مرکزی به همراه انحراف معیار به عنوان مهمترین شاخصهای پراکندگی محاسبه خواهد شد، انحراف معیار نیز پراکندگی دادهها را نشان میدهد. این اقدام به منظور ارائه دیدگاهی کلی نسبت به جامعه آماری و شناخت بیشتر آن صورت میگیرد.

3-7-2 بررسی نرمال یا غیر نرمال بودن دادههای پژوهش
برای اجرای روش های آماری و محاسبه آماره آزمون مناسبت و استنتاج منطقی درباره فرضیههای پژوهش مهمترین عمل قبل از هر اقدامی، انتخاب روش آماری مناسب برای پژوهش است برای این منظور آگاهی از توزیع دادهها از اولویت اساسی برخوردار است.
برای همین منظور در این پژوهش از آزمون معتبر جارکو- براو برای بررسی فرض نرمال بودن دادههای پژوهش استفاده شده است.
آزمون جارکو-برا روش ناپارامتری سادهای برای تعیین همگونی اطلاعاتی تجربی با توزیع فراوانی مشاهدهها جمعآوری شده است. این آزمون برای گرفتن مجوز لازم جهت استفاده از رگرسیون و ضریب همبستگی پیرسون بر متغیرهای مستقل و وابسته اعمال میگردد تا نرمال بودن اطلاعات اثبات گردد.

3-7-3 دادههای پانل (دادههای تابلویی)
مدلهای اقتصادی از نظر استفاده از دادههای آماری به سه بخش تقسیم میشوند، در برخی از آنها برای برآورد مدل، از اطلاعات سری زمانی استفاده میشود. در مدلهای مبتنی بر سریهای زمانی، مقدار متغیرهای مختلف مدل، تابعی از زمان هستند. بعضی دیگر از مدلها بر اساس دادههای مقطعی برآورد میشوند. در مدلهای مبتنی بر دادههای مقطعی، زمان به هیچ عنوان نقشی نداشته و مقدار متغیرهای مختلف مدل تابعی از مقاطع مختلف است. در برخی از مطالعهها، طراحی مدلهایی که صرفاً مبتنی بر آمارهای سری زمانی و یا مقطعی است، فروض ضمنی محدودکنندهای بر نتایج حاصل، تحمیل میکند و منجر به کاهش اعتبار نتایج به دست آمده از مدل میشود. بنابراین برای افزایش دقت مطالعه، تفکیک این دو مقوله ضروری است. روش سوم برآورد مدل که در سالهای اخیر بیشتر مورد توجه قرار گرفته است، برآورد مدل بر اساس دادههای پانل است. در این روش یک سری واحدهای مقطعی طی چند سال مورد برازش قرار میگیرند. تحلیل با دادههای ادغام شده، محیطی بسیار غنی از اطلاعات را برای گسترش فنون تخمین و نتایج نظری فراهم میآورد.
در بسیاری از موارد محققان از این روش، برای مواردی که نمیتوان مسائل را به صورت سری زمانی یا مقطعی بررسی کرد یا زمانی که تعداد دادهها کم است، استفاده میکنند. از آنجا که لحاظ نکردن برخی از متغیرها در ساختار مدلها موجب ایجاد عدم کارایی در برآوردهای مدلهای اقتصادسنجی میشود، روش دادههای تلفیقی که از ترکیب اطلاعات سریهای زمانی و دادههای مقطعی تشکیل شده است، اثر این نوع متغیرهای لحاظ نشده یا غیر قابل اندازهگیری را بهتر از دادههای مقطعی طی یک سال یا دادههای سری زمانی برای یک مقطع زمانی نشان میدهد. دادههای تلفیقی روند گذشته متغیرها را در بر گرفته و از نظر لحاظ کردن پویایی متغیرها اطمینان ایجاد میکند. یک مدل تجربی بزرگ میتواند به طور کاملتری روابط بین متغیرهای مربوطه، اثرات مثبت و منفی که به لحاظ آماری معنادار هستند، متغیرهای زمان و مکان، اثرات و روابط متقابل بین متغیرها را مشخص کند. ادغام دادههای سری زمانی و مقطعی و ضرورت استفاده از آن بیشتر به علت افزایش تعداد مشاهدهها و بالا بردن درجه آزادی است.

3-7-4 آزمون F لیمر
در خصوص استفاده از پانل، آزمون مربوط به همگنی مقاطع انجام میپذیرد. در صورتی که شرکتها همگن باشند، میتوان به سادگی از روش حداقل مربعات معمولی استفاده نمود، در غیر این صورت، ضرورت استفاده از پانل ایجاب میگردد. در آزمون F فرضیه H_0 یکسان بودن عرض از مبدأها (روش پولینگ یا ترکیبی)، در مقابل فرضیه مخالف H_1، ناهمسانی عرض از مبدأها (روش دادههای تابلویی) قرار میگیرد. بنابراین در صورت رد فرضیه H_0 روش دادههای تابلویی پذیرفته میشود.
فرضیههای این آزمون بر اساس μ_i ها، که بیانکنندهی اثرات فردی و یا ناهمگنیها هستند به صورت زیر است:
H_0=μ_1=μ_2=…=μ_N=0
H_1= ها مخالف صفر استμ_(i ) حداقل یکی از
این آزمون با استفاده از مجموع مربعات باقیمانده مقید (〖RSS〗_R) حاصل از مدل ترکیبی به دست آمده از OLS و مجموع مربعات باقیمانده غیر مقید (〖RSS〗_UR) حاصل از تخمین رگرسیون درون گروهی به صورت زیر است:
i =1,2,…,NY_i=Z_i δ+U_i مدل مقید
i =1,2,…,NY_i=Z_i δ+U_i مدل نامقید
آماره آزمون Fبه شرح زیر است:
(3-1)
که در آن Nتعداد مقاطع، K تعداد متغیرهای توضیحی و T تعداد مشاهدهها در طول زمان است. با مقایسه آماره F محاسباتی با Fجدول، میتوان در صورت بزرگتر بودن آماره F محاسباتی از روش پانل استفاده کرد.

3-7-5 آزمون هاسمن
برای تشخیص اینکه در برآورد مدلهای پانل دیتا، کدام روش (اثرات ثابت و اثرات تصادفی) مناسب میباشد، از آزمون هاسمن (1980) استفاده میشود. در آزمون هاسمن، فرضیه صفر و فرضیه مقابل آن به صورت زیر بیان میگردد:
H_0:E(U_i,X_i )=0
H_1:E(U_i,X_i )≠0
فرضیه صفر به معنای این است که بین جمله خطا (که در بر گیرندهی اثرات فردی است) و متغیرهای توضیحی، هیچ ارتباطی وجود ندارد و در واقع مستقل از یکدیگر میباشند. این در حالی است که فرضیه مقابل به این معنی است که بین جزء اخلال و متغیرهای توضیحی، همبستگی وجود دارد(اشرف زاده و مهرگان، 1387).
در صورت رد فرضیه صفر، بهتر است که از روش اثرات ثابت استفاده شود.
اگر b تخمینزننده روش اثرات ثابت، و β ̂ تخمینزن روش تصادفی باشد، آنگاه میتوان نوشت:
(3-2) Var(b-β ̂ )=Var(b)-Var(β ̂ )
هاسمن ثابت نمود که عبارت مذکور دارای توزیع  میباشد.
(3-3)
K: تعداد متغیرهای توضیحی
اگر آماره محاسبه شده از این آزمون از 2K2 بزرگتر باشد، فرضیه صفر مبنی بر اثر تصادفی رد شده و فرض اثر ثابت پذیرفته میشود.

3-7-6 مدل اثرات ثابت
استدلال پايهاي مدل اثرات ثابت آن است كه در تصريح مدل رگرسيوني نميتوان متغيرهاي توضيحي مناسب را كه طي زمان تغيير نميكنند، وارد مدل كنيم. از اين رو، وارد كردن متغيرهاي مجازي، پوشش و جبراني بر اين بيتوجهي و ناآگاهي ميباشد. استفاده از دادههاي تابلويي با اثرات ثابت، يك راه حل مناسب براي عدم تشخيص رگرسيون به خصوص زماني كه اثرات ويژه هر واحد (اثرات فردي) بر اثرات زماني آن غالب ميباشد، خواهد بود. یک روش متداول در فرمولبندی مدل پانل دیتا بر این فرض استوار است که اختلاف بین مقطعها را میتوان به صورت تفاوت در عرض از مبدأ نشان داد. به فرض که Y_i و X_i شامل t مشاهده برای واحد i ام باشد و ε_i بردار جزء اختلال بوده و دارای ابعاد T×1 بوده باشد، در نتیجه داریم:
[█(Y_1@Y_2@.@.@.@Y_n )]=[█(IO..O@OI..O@..@..@..@0..I)][█(a_1@a_2@.@.@.@a_n )]+[█(X_1@X_2@.@.@.@X_n )]β+[█(ε_1@ε_2@.@.@.@ε_n )]
که در این فرمولها i بردار یکه با ابعاد T×1میباشد، مدل فوق را میتوان به شکل خلاصه به صورت زیر نوشت.
(3-4) Y=[d_1 d_2…d_n X][aβ]+ε
که d_i متغیر مجازی برای نشان دادن i امین مقطع میباشد. حال اگر ماتریس D را به صورت:
(3-5) D=[d_1 d_2…d_n ]
با ابعاد n و n×T تعریف کنیم، خواهیم داشت:
Y=Dα+Xβ+ε (3-6)
که این رابطه به عنوان مدل حداقل مربعات متغیر مجازی (LSDV)نامیده میشود.
مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست. میتوان مدل را با استفاده از روش OLSباK رگرسور در Xو n ستون در D به عنوان یک مدل چند متغیره با n+k پارامتر برآورد کرد. عرض از مبدأ در مدل رگرسيون به اين دليل بين افراد متفاوت است كه هر فرد يا واحد مقطعي، ويژگيهاي خاص خود را داراست. براي ملاحظه عرض از مبدأهای مختلف ميتوان از متغيرهاي موهومي استفاده كرد. مدل اثرات ثابت با استفاده از متغيرهاي موهومي مدل حداقل مربعات با متغير موهومي LSDV)) ناميده ميشود. مدل اثرات ثابت در شرايطي مناسب است كه عرض از مبدأ خاص فرد با يك يا چند متغير توضيحي همبستگي داشته باشد. يكي از معايب (LSDV) است كه وقتي تعداد واحدهاي مقطعي (N) خيلي بزرگ باشد، به تعداد زيادي درجه آزادي نياز داريم. در چنين حالتي ناچاريم N-1متغير موهومي وارد مدل كنيم و عرض از مبدأ را نيز داشته باشيم كه اين كار شرايط ايجاد همخطي را فراهم مينمايد(ابريشمي، 1383).

3-7-7 مدل اثرات تصادفي
در مدل اثرات تصادفي فرض ميشود كه عرض از مبدأ يك واحد تكي، انتخابي تصادفي از جامعهاي بزرگتر با يك ميانگين ثابت است. بدين ترتيب عرض از مبدأ تكي، به صورت انحرافي از اين ميانگين ثابت بيان ميشود. يكي از مزاياي مدل اثر تصادفی نسبت به مدل اثرات ثابت اين است كه به درجههای آزادي كمتري نياز دارد، چون نبايد N عرض از مبدأ مقطعي تخمين زده شود و تنها لازم است، ميانگين و واريانس عرض از مبدأ را تخمين بزنیم. مدل اثرات تصادفی در شرايطي مناسب است كه عرض از مبدأ (تصادفی) هر واحد مقطعي با متغيرهاي توضيحي، همبستگي نداشته باشد(ابریشمی، 1383).
ايده اساسي و اوليه با معادله زیر شروع ميشود:
(3-7) Y_(i,t)=β_1i+β_2 X_it+U_it
طرفداران روش اثرات تصادفي معتقدند، به جاي اينكه در معادله فوق، β_1i را ثابت فرض کنید، آن را به صورت یک متغیر تصادفی با میانگین β_1 در نظر گرفته و مقدار عرض از مبدأ براي هر مقطع را به صورت زير بيان نماييد.
(3-8) β_1i=β_1+ε_i
که در آن ε_i جمله خطای تصادفی با میانگین صفر و واریانس σ_ε^2 است.
فرض اساسي در مدل اثرات تصادفي اين است، كه مقاطع مورد مطالعه متعلق به جامعهاي بزرگتر بوده و ميانگين مشتركي براي عرض از مبدأ دارند. اختلاف در مقادير عرض از مبدأ هر مقطع در جمله خطای 〖 ε〗_i منعكس ميشود. بر اساس مدل اثرات تصادفي، معادله به صورت زير خواهد بود:
Y_(i,t)=β_1+β_2 X_it+ε_i+U_it
Y_(i,t)=β_1+w_(i,t)=ε_i+u_(i,t) (3-9)
β_2 X_it+w_(i,t)
جمله خطاي تركيبي 〖 w〗_(i,t) متشكل از دو جزء ε_i (خطاي مقطعي) و 〖 u〗_(i,t)(خطاي تركيبي) ميباشد. اطلاق مدل اجزاء خطا به اين دليل ميباشد كه جمله خطاي تركيبي w_(i,t)، از دو یا چند جزء خطا تشکیل شده است. ساختار جمله خطا در روش اثرات تصادفی به گونهاي است كه بايد اين روش را با كمك حداقل مربعات تعميم يافته (GLS) برآورد کرد. خاطر نشان ميشود كه اگر در الگوي تابلويي مورد نظر فقط اثرات فردي را در جملات خطا (چه با اثرات ثابت و چه با اثرات تصادفي) لحاظ نماييد، الگوي مورد نظر به صورت الگوي جزء خطاي يك جانبه خواهد بود. اما اگر علاوه بر اثرات فردي، اثرات زماني يا پوياييهاي مقطع مربوطه در طي زمان نيز لحاظ شود، الگوي مورد نظر به صورت الگوي جزء خطاي دو جانبه ميباشد.

3-7-8

پایان نامه
Previous Entries پایان نامه با کلمات کلیدی بورس اوراق بهادار، بورس اوراق بهادار تهران، اعلان سود، جامعه آماری Next Entries پایان نامه با کلمات کلیدی اثرات ثابت، سریهای زمانی، تحلیل داده، رگرسیون