
مدل زیر نشان دهنده یک مدل با دادههای ترکیبی است:
(4-2)
که در آن i=1,2,…,n نشان دهنده واحـــدهای مقطعی و t=1,2,…,T بر زمان اشاره دارد. متغیر وابسته را برای i امین واحد مقطعی در سال t و نیز kامین متغیر مستقل غیر تصادفی برای iامین واحد مقطعی در سال tام است. فرض میشود جمله اخلال دارای میانگین صفر، E( و واریانس ثابت E( است. پارامترهای مدل مجهول است که واکنش متغیر وابسته نسبت به تغییرات kامین متغیر مستقل در iامین مقطع و tامین زمان را اندازه گیری میکند. در حالت کلی فرض میشود که این ضرایب در میان تمامیواحدهای مقطعی و زمانی مختلف متفاوت است. ولی در بسیاری از مطالعات پژوهشی متغیر بودن این ضرایب هم برای تمامیمقاطع و هم برای تمامیزمانهای بسیار محدود کننده است و باید نسبت به ماهیت موضوع مورد مطالعه و سایر شرایط، پژوهشگر خود فرضهای مقتضی را در خصوص پارامترها تعیین کند. این مدل را میتوان به پنج حالت زیر تقسیم کرد:
1- تمام ضرایب ثابتاند و فرض میشود که جمله اختلال قادر است تمام تفاوتهای میان واحدهای مقطعی و زمان را دریافت کند و توضیح دهد.
(4-3)
2- ضرایب مربوط به متغیره(شیبها)ثابت اند و تنها عرض از مبدأبرای واحدهای مختلف مقطعی متفاوت است.
(4-4)
3- ضرایب مربوط به متغیرها ثابت اند ولی عرض از مبدأ مابین مقاطع و بین دورهها متفاوت است.
(4-5)
4- همه ضرایب برای تمام واحدهای مقطعی متفاوت است.
(4-6)
5- تمام ضرایب هم نسبت به زمان و هم نسبت به واحدهای مقطعی متفاوت است.
(4-7)
در خصوص روشهای تخمین مدلهای مذکور میتوان گفت که در حالتهای 2، 3و4 بسته به این که کدامیک از ضرایب ثابت یا متغیر باشند، به مدلهای ثابت(Fixed Effect) یا تاثیرات تصادفی (Random Effect)تقسیم میشوند.
3-11 مراحل روش تخمین مدل بوسیله دادههای تلفیقی
سؤالی که اغلب در مطالعات کاربردی مطرح میشود این است که آیا شواهدی دال بر قابلیت ادغام شدن دادهها وجود دارد یا اینکه مدل برای تمام واحدهای مقطعی متفاوت است. بعبارت دیگر آیا در مدل مورد نظر برای مقاطع مختلف هم شیبها و هم عرض از مبدأها متفاوت است. این سؤال را میتوان با فرضیه زیر مطرح نمود:
(4-8)
فرضیه مذکور را میتوان به عنوان یک مجموعه قیود خطی روی ضرایب در نظر گرفت و برای آزمون که به chow test معروف است ار آماره F به صورت ذیل استفاده نمود:
(4-9)
که در آن :
: مجذور پسماندهای حاصل از برازش رگرسیون مقید است.
: مجذور پسماندهای حاصل از برازش رگرسیون نا مقید هر یک از معادلات
با استفاده از روش حداقل مربعات معمولی میباشد. در صورتیکه فرض
پذیرفته نشود، دلیل بر یکسان فرض نمودن شیبها و عرض از مبدأ واحدهای مختلف مقطعی وجود ندارد.
آزمون دیگری مطرح است که با فرض متفاوت بودن عرض از مبدأ مقاطع فرضیه زیر را مطرح نمود.
(4-10)
که این فرضیه به صورت یک مجموعه قیود خطی فقط روی ضرایب متغیرهای توضیحی در نظر گرفته میشود که برای آزمون فرضیه مذکور از آماره F به صورت ذیل استفاده میشود.
(4-11)
که در آن :
: مجذور پسماندهای حاصل از برازش رگرسیون مقید است.
:مجذور پسماندهای حاصل از برازش رگرسیون نا مقید هر یک از معادلات
با استفاده از روش حداقل مربعات معمولی میباشد. در صورتیکه فرض پذیرفته شود، سؤال اساسی دیگری مطرح خواهد شد و آن این است که آیا تفاوت در مقاطع مختلف میتوان بوسیله عرض از مبدأ خاص در واحد پاسخگو باشد. به عبارت دیگر آیا تفاوت در عرض از مبدأ واحدهای مقطعی به طور ثابت عمل میکند یا اینکه عملکردهای تصادفی میتوانند این اختلاف بین واحدها را بطور واضح تری بیان نماید که به ترتیب این دو روش در ادبیات دادههای تلفیقی به روشهای ثابت و اثرات تصادفی مشهور هستند که ذیلاً روشهای فوق الذکر به اختصار مورد بحث قرار میگیرد. (Rodring,1999)
اثرات ثابت
یک روش متداول در فرمولبندی کردن مدل دادههای تلفیقی، براین فرض استـــوار است که اختلافــــات بین واحدها را میتوان به صورت تفاوت عرض از مبدأ نشان داد و بنابراین در رابطه فوق هر xi یک پارامتر ناشناخته ای است که باید برآورد گردد.
به فرض که yi و xi شامل T مشاهده برای واحد iام باشند و بردار جزء اخلال بوده و دارای ابعاد T. 1 بوده باشد در نتیجه رابطه را به صورت زیر میتوان نوشت:
(4-12)
که در این فرمولها Iبردار یکه با ابعاد T. 1 میباشد مدل فوق را میتوان به شکل خلاصه زیر نوشت.
(4-13) Y=
که متغیر مجازی برای نشان دادن iامین مقطع میباشد حال اگر ماتریس D را به صورت با ابعاد تعریف کنیم خواهیم داشت.
(4-14) Y=Dα+Xβ+ε
که این رابطه به عنوان مدل حداقل مربعات متغییر مجازی(LSDV)نامیده میشود. مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست و میتوان مدل را با استفاده از روش OLS با K رگرسور در X و n ستون در D به عنوان یک مدل چند متغیره با n+k پارامتر برآورد کرد. لازم به ذکر است که میتوان در روش اثرات ثابت، عرض از مبدأ را طوری برآورد کرد که نه تنها در مقاطع مختلف بلکه در زمانهای مختلف نیز متفاوت از هم باشند.
اثرات تصادفی
مدلهای اثرات ثابت تنها در صورتی منطقی خواهد بود که ما اطمینان داشته باشیم که اختلاف بین مقاطع را میتوان به صورت انتقال تابع رگرسیون نشان داد، در حالیکه ما همیشه از وجود این موضوع مطمئن نیستیم. لذا روشهای دیگر مورد استفاده قرار میگیرند. روش دیگر برآورد، روش اثرات تصادفی است که فرض میکند جزء ثابت مشخص کننده مقاطع مختلف به صورت تصادفی بین واحدها و مناطق توزیع شده است. با توجه به این مورد، مدل با اثرات تصادفی به شکل زیر خواهد بود:
(4-15)
که دارای K رگرسور به اضافه یک عرض از مبدأ میباشد. مؤلف مشخص کننده جزء تصادفی مربوط به iامین واحد بوده ودر طول زمان ثابت است. در مطالعات کاربردی، میتوان را آن دسته از ویژگیهای خاص مربوط به هر مقطع در نظر گرفت که در مدل وارد نشده اند. باید توجه داشت که در این حالت واریانسهای مربوط به مقاطع مختلف با هم یکسان نبوده و مدل ما دچار واریانس ناهمسانی میباشد که باید از روش GLS استفاده نمود. با معرفی این دو روش سؤالی که پیش میآید این است که در عمل میبایستی کدامیک از روشهای مذکور را استفاده کنیم که برای تصمیمگیری از آزمون هاسمن کمک میگیریم.
3-12 آمارههاسمن
آماره این آزمون که برای تشخیص ثابت یا تصادفی بودن تفاوتهای واحدهای مقطعی به صورت زیر محاسبه میشود که دارای توزیع کای-دو با درجه آزادی برابر با تعداد متغیرهای مستقل (K) است.
(4-16)
(4-17)
فرضیه صفر بودن آزمونهاسمن، برابری برآورد کننده هر دو روش حداقل مربعات تعمیم یافته و متغیر مجازی است یعنی داریم:
(4-18)
چنانچه آماره آزمون محاسبه شده بزرگتر از جدول باشد فرضیه H0 رد میشود پس برابری برآوردهای این روش رد و توصیه میشود از روش تصادفی برای دریافت در واحدهای مقطعی استفاده شود، در شکا زیر مراحل مختلف آزمونها مشخص گردیده است.
در حالت کلی، همانطور که قبلاً ذکر شد مدل زیر بصورت ماتریسی نشان دهنده یک مدل با دادههای ادغام شده است.
(4-19)
که در آن متغیر وابسته مربوط به واحد iام در زمان t تابعی است از که مقادیر k متغیر مستقل مربوط به واحد iام در زمان t را در بر دارد. اما جمله خطا، که در ادبیات اقتصاد سنجی برآیند تأثیر کلیه متغیرهایی است که بر تاثیر دارند، صریحاً وارد الگو نگردیده که نقطه افتراق اقتصاد سنجی اطلاعات تلفیقی با اقتصاد سنجی اطلاعات سری زمانی و یا مقطعی است. در رابطه فوق جمله خطا میتواند توسط سه جزء هدایت شود:
الف- ، متغیرهایی که برای واحدهای مقطعی متفاوت، اما در طول زمان ثابت هستند، به عنوان نمونه ای از این متغیرها میتوان به مدیریت در نمونه ای متشکل از چند شرکت تولیدی و در یک دوره زمانی معین اشاره کرد. عامل مدیریت بین شرکتها تفاوت دارد، اما برای هر شرکت در طول زمان ثابت است. جنسیت، توانایی و متغیرهای اقتصادی، اجتماعی نیز نمونههای دیگر از این متغیرهاست.
ب- ، متغیرهایی که برای تمام واحدهای مقطعی در زمان مشابه یکسان هستند اما در طول زمان تغییر
میکنند. نمونه این نوع متغیرها، میتواند قیمت، نرخ بهره و یا انتظارات نسبت به آینده باشد.
ج- ، متغیری که نه تنها در طول زمان تغییر میکنند بلکه در هر زمان بین واحدهای مقطعی نیز متفاوتند. مثال این متغیره، حجم سرمایه، فروش و یا سود در واحدهای تولیدی است.
شکل(4-1) مراحل مختلف آزمونهای بکار رفته جهت تخمین
در اقتصاد سنجی اطلاعات سری زمانی و یا مقطعی، جمله خطا تنها از جزء سوم تشکیل شده است، یعنی اما در اقتصاد سنجی اطلاعات تلفیقی در حالت اصطلاحاً یکطرفه و برای حالت دو طرفه میباشد که عرض از مبدأ برای مدلهای دوطرفه و یکطرفه به صورت ذیل میباشد.
(4-20)
و برای مدلهای یک طرفه:
(4-21)
برای حالت یک طرفه در مدل ما فرض میکنیم که عرض از مبدأهای مختلف در مقاطع گوناگون اما در طول زمان یکسان است. گزینش شکل و نوع خطا از بین دو حالت ذکر شده مقوله ای تجربه است.
3-13خلاصه فصل
دستیابی به هدفهای تحقیق میسر نخواهد بود مگر زمانی که جستجوی شناخت با روش شناسی درست صورت پذیرد. پایه هر علمی، روش شناخت آن است و اعتبار و ارزش قوانین علمیبه روش شناختی مبتنی است که در آن علم به کار میرود. روش تحقیق مجموعه ای از قواعد، ابزارها و راههای معتبر (قابل اطمینان) و نظام یافته برای بررسی واقعیتها، کشف مجهولات و دستیابی به راه حل مشکلات است در این فصل بعد از تبیین روش تحقیق و نحوه گرد آوری دادهها، جامعه آماری تحقیق مشخص ودر ادامه فصل بعد روشها و تکنیکهای آماری مورد استفاده برای تحلیل دادهها مورد استفاده توضیح داده شد.
فصل چهارم
تخمین مدل
4-1 مقدمه
تحليل رگرسيوني، روشي آماري جهت بررسي رابطه بين متغيرها و به طور كلي پژوهشهاي علّي است. در اين روش رابطه بين متغير يا متغيرهاي مستقل با متغير وابسته نشان داده مي شود. ساده ترين مدل رگرسيون، مدل رگرسيون خطي است كه تنها شامل يك متغير مستقل و يك متغير وابسته با رابطه خطي مي باشد. این مدل اولين بار توسط ودربورن و فلدر در سال 1972 معرفي شد و مبناي تحليل رگرسيوني قرار گرفت (مومنی و قیومی، 1388، 104).
در رگرسیون خطی ما به دنبال برآورد رابطه ریاضی و تحلیل آن هستیم. به طوری که بتوان به کمک آن کمیت یک متغیر مجهول را با استفاده از متغیر یا متغیرهای معلوم، تعیین کرد. با فرض آن که رابطه علت و معلولی بین دو متغیر کمیوجود دارد و این رابطه به صورت خطی میباشد، معادله رگرسیون به شکل زیر نوشته میشود:
Y= α + βx
که در آن β شیب خط و α عرض از مبدا (محل تلاقی با محور y) است. رگرسیون خطی چند متغیره نیز زمانی استفاده میشود که دو یا چند متغیر تاثیر عمده ای روی متغیر وابسته داشته باشند. در این وضعیت از رگرسیون چندگانه جهت پیش بینی متغیر وابسته استفاده میشود. در رگرسیون چندگانه نیز فرض خطی بودن متغیرها برقرار میباشد و بر همین اساس معادله رگرسیون چندگانه به شکل زیر تعریف میشود:
y = α0 + b1x1 + b2x2 + … + bnxn
در این تحقیق با توجه به نوع متغیر وابسته، جهت بررسی روابط بین متغیرها از رگرسیون خطی دو متغیره استفاده میشود. پس از انجام تحلیل
