پایان نامه ارشد رایگان درمورد داده های ترکیبی، پانل دیتا، سری های زمانی، روش حداقل مربعات

دانلود پایان نامه ارشد

داده های ترکیبی در اقتصاد سنجی، برتری های زیادی نسبت به استفاده از داده های مقطعی یا سری زمانی دارد. داده های ترکیبی اطلاعات مقاطع متفاوت و پویایی آنها را همزمان در نظر می گیرد. از جمله مزایای داده های ترکیبی عبارتند از:
1. از آنجا که لحاظ نکردن برخی از متغیرها در ساختار مدل ها موجب ایجاد عدم کارایی در برآورد مدل های اقتصاد سنجی می شود، روش داده های ترکیبی که از اطلاعات سری های زمانی و داده های مقطعی تشکیل شده است، اثر این نوع متغیرهای لحاظ نشده یا غیر قابل اندازه گیری را بهتر از داده های مقطعی طی یک سال یا داده های سری های زمانی برای یک مقطع نشان می دهد. داده های ترکیبی روندهای گذشته متغیرها را در می گیرد و از نظر لحاظ کردن پویایی متغیرها، اطمینان ایجاد می کند.
2. محققین می توانند از داده‌های پانلی برای مواردی که مسائل را نمی توان صرفاً به صورت سری زمانی یا برشهای مقطعی بررسی کرد، بهره گیرند. مثلاً در بررسی تابع تولید مساله ای که وجود دارد این است که بتوان تغییرات تکنولوژیک را از صرفه‌های به مقیاس تفکیک کرد. در این گونه موارد داده‌های مقطعی فقط اطلاعاتی را در مورد صرفه‌های به مقیاس فراهم می آورد. در حالی که داده‌های سری زمانی اثرات هردو را بدون هیچ گونه تفکیکی نشان می دهد. تلفیق داده‌های سری زمانی با داده‌های مقطعی نه تنها می تواند اطلاعات سودمندی را برای تخمین مدلهای اقتصادسنجی فراهم آورد، بلکه بر مبنای نتایج بدست آمده می توان استنباط‌های سیاستگزاری در خور توجهی نیز به عمل آورد.
3. داده‌های پانلی حاوی اطلاعات بیشتر، تنوع گسترده تر و هم خطی کمتر میان متغیرها بوده و در نتیجه کاراتر می باشند. در حالیکه در سریهای زمانی هم خطی بیشتری را بین متغیرها مشاهده می کنیم. با توجه به اینکه داده‌های پانلی ترکیبی از سری‌های زمانی و مقطعی می باشد، بعد مقطعی موجب اضافه شدن تنوع زیادی شده و در نتیجه برآوردهای معتبرتری را می توان انجام داد. در اینجا تعداد مشاهدات ما به NT افزایش یافته که منجر به برآوردهای کاراتری از متغیرها می شود.این امر را می توان در محاسبه واریانس جامعه مشاهده کرد. در داده‌های سری زمانی این واریانس به صورت σ^2=σ2/N-K محاسبه می‌شود ولی در داده‌های پانلی به صورت σ^2=σ2/NT-N-K قابل محاسبه است. چون مخرج کسر دومی بزرگتر از کسر اولی است، پس واریانس داده‌های پانلی کمتر بوده و بنابراین تخمین کاراتری خواهد داشت.
4. داده‌های پانلی امکان طراحی الگوهای رفتاری پیچیده تری را فراهم می کنند.
5. داده‌های پانلی امکان بیشتری را برای شناسایی و اندازه گیری اثراتی فراهم می کنند که با اتکای صرف به آمارهای مقطعی یا سری زمانی به سادگی قابل شناسایی نیستند.(پایتختی و طبقچی،1391)
6. گاهی استدلال میشود دادههای مقطعی، رفتارهای بلندمدت را نشان میدهند، در حالی که در دادههای سری زمانی براثرات کوتاهمدت تأکید میشود. با ترکیب این دو خصوصیت در دادههای تابلویی، که خصوصیت متمایز پانل دیتاست، ساختار عمومیتر و پویاتری را میتوان تصریح و برآورد کرد.
3-3- مدل‌سازي داده‌هاي تابلويي
براي بررسي داده‌هاي ترکيبي از معادله ذيل شروع مي‌کنيم:

در رابطه فوق i=1, 2, …, N نشان‌دهنده‌ي واحدهاي مقطعي (مثلاً کشورها)، t=1,2,…,T زمان و j=1, 2, …, k شماره‌ي متغير مستقل غير تصادفي (قابل مشاهده) مي‌باشد. نشان‌دهنده‌ي متغير وابسته براي i امين واحد مقطعي در سال t، نشان‌دهنده‌ي متغير توضيحي j ام مشاهده شده براي i امين مقطع در سال t ام و نماد نشانگر خطاي برآورد داده‌هاي ترکيبي است.
عرض از مبدأ براي هريک از مقطع‌ها نشان‌دهنده‌ي خصوصيات مشاهده نشده آن مقطع و همچنين عرض از مبدأ براي هريک از دوره‌هاي زماني نشان‌دهنده‌ي خصوصياتي مشاهده نشده از آن دوره‌ي زماني است.
با توجه به معادله (3-1)، با اعمال محدوديت در مورد ضرايب مي‌توان 5 حالت مختلف، مطابق جدول 3-2، از معادله 3-1 متصور بود که در ذيل به بررسي آن مي‌پردازيم:

شکل (3-1)

تمامي ضرايب ثابت و فرض مي‌شود که جمله اختلال قادر است تمام تفاوت‌هاي ميان واحدهاي مقطعي و زمان را دريافت و توضيح دهد.

ضرايب مربوط به متغيرها (شيب) ثابت‌اند و تنها عرض از مبدأ براي واحدهاي مختلف مقطعي متفاوت است.

ضرايب مربوط به متغيرها (شيب) ثابت‌اند ولي تنها عرض از مبدأ مابين مقاطع و بين دوره‌ها متفاوت است.

همه‌ي ضرايب براي تمامي واحدهاي مقطعي متفاوت است.

تمامي ضرايب هم نسبت به زمان و هم نسبت به واحدهاي مقطعي متفاوت است.

3-4- روش شناسی تحقیق
در اقتصاد سنجي پايه، معمولا تغييرات يک متغير بر حسب تعدادي از متغيرها با اعتقاد بر اين که تغييرات اين متغيرها باعث تغيير متغير وابسته ميشود مورد بررسي قرار ميگيرد و اين رابطه را به صورت يک تابع (رابطه-1) بيان ميکنند:

رابطه-1
Yi=f(Xki) , k= 1, 2,….,k و i= 1, 2, …., N

انديس k تعداد متغيرهاي توضيحي را نشان ميدهد. اغلب براي شروع شکل اين تابع را خطي فرض ميکنند.
مدل پانل ديتا17 يکي از پرکاربردترين روشهاي اقتصادسنجي در برآورد معادلات و روابط اقتصادي ميباشد. چرا که در مدلهاي پانل ديتا متغيرها هم در ميان مقاطع جامعه آماري که تعداد آن (N) و هم در طول زمان اندازه گيري ميشود (اشرف زاده و مهرگان، 1389). مدل پانل دیتا به دو صورت پانل دیتای ایستا و پویا دسته بندی شده است که در ادامه به بررسی مبانی اقتصاد سنجی این روشها پرداخته میشود.

3-4-1- مدل پانل ديتا
در مدل پانل ديتا دادهها به صورت سري زماني و مقطع ميباشند، يعني دادهها در طول زمان در بين مقاطع (افراد) مورد اندازه گيري قرار ميگيرند. مدل خطي رگرسيون پانل ديتا به صورت رابطه (2) نشان داده ميشود:
رابطه-2
Yit = βi0 + β1x1it + β2x2it + … + βkxkit + εit

و به صورت ماتريسي هم به صورت رابطه (3 و 4) بيان ميگردد:

رابطه-3
Yit =xitβ + εit i= 1,…,N و t= 1,…, T
رابطه-4
Yit =xitβ + εit i= 1,…,N و t= 1,…, T

که i= مقاطع و T: دوره زماني را نشان ميدهند.
با توجه به اصول و مباني اقتصادسنجي مدل مذکور با روش حداقل مربعات معمولي (OLS) تخمين زده ميشود و ضرايب β ها به دست ميآيد. اما معرفي عرض از مبدا و فرضيات مختلف در مورد اثر متغيرهاي توضيحي Xit بر متغير وابسته Yit رويکردهاي مختلفي به وجود ميآورد. سئوالي که مطرح ميشود ميتواند اين باشد که؛ چه ارتباطي بين عرض از مبداهاي مختلف براي هر مقطع و متغيرهاي توضيحي وجود دارد؟ يا اينکه متغيرهاي توضيحي که باعث تغيير متغير وابسته ميگردند عرض از مبدا را به خود مشروط خواهند کرد يا هر مقطع يا به طور مشخص هر فرد به طور تصادفي مقداري مستقل از متغيرهاي توضيحي براي تنظيم مقدار تعادلي y را براي خود انتخاب خواهد کرد؟
براي پاسخ به اين سئوالات در مدل پانل ديتا از بحث اثر ثابت18 و يا اثر تصادفي19 استفاده ميشود. در مورد اثر ثابت يا اثر تصادفي بايد به نکات زير توجه نمود:
الف) اگر فرض شود تمام افراد يا مقاطع در پانل کاملاً همگن هستند در اين صورت لازم نيست نگران عرض از مبداهاي مختلف براي هر فرد يا مقطع بود، در واقع رويکرد پانل ديتا به خوبي ميتواند نا همگني هاي ميان مقاطع را بيان نمايد.
ب) رويکرد اثر ثابت،iµ را جملهاي ثابت و مخصوص هر مقطع در مدل رگرسيوني فرض ميکند. در حالي که مدل اثر تصادفي فرض ميکند iµ يک جمله تصادفي براي هر گروه مي باشد، اما در هر دوره زماني از اين توزيع تصادفي iµ ها فقط يک رخداد به طور يکسان در هر دوره مدل رگرسيوني وارد ميشود. به عبارت ديگر براي کل دوره زماني براي هر مقطع يک iµ وجود دارد.
براي درک درست تر فرض ميشود مدل رگرسيوني به صورت رابطه (5) ميباشد:

رابطه-5
Yit =xitβ + εit

حالا فرض ميشود ساختار زير براي εitبه صورت رابطه (6) وجود دارد:

رابطه-6
εit = µi + vit

فرض ميشود vit با xit همبسته نيست. جمله اول در رابطه بالا مربوط به افراد يا مقاطع ميباشد. εit از دو بخش تشکيل شده است که بخش اول در ميان افراد يا مقاطع تغيير ميکند اما در طول زمان ثابت است. اين بخش ممکن است با X همبسته باشد يا نباشد.
بخش دوم به طور غير سيستماتيک يا مستقل در طول زمان و ميان مقاطع تغيير ميکند و فرض بر اين است که با X همبسته نيست. لذا ميتوان دريافت که دو مشاهده از يک فرد نسبت به مشاهدات مربوط به دو فرد بيشتر شبيه يکديگرند اشرف زاده و مهرگان (1389). بنابراين ميتوان بيان داشت که:
الف) در مدل اثر تصادفي: iµ ها با X همبسته نيستند.
ب) در مدل اثر ثابت : iµ ها با X همبسته هستند.

3-4-1-1- مقايسه برآورد اثر تصادفي با اثر ثابت
در تحليل رگرسيون، يک رويه استاندارد اين است که فرض ميشود عوامل زيادي که بر متغير وابسته اثر گذار هستند اما به طور صريح به عنوان متغير توضيحي وارد مدل نميشوند را ميتوان در جمله پسماند تصادفي خلاصه نمود، يعني اثرات اين متغيرها در جمله پسماند جمع ميشود. وقتي واحدهاي منفرد متعدد در طول زمان مشاهده ميگردد گاهي اوقات فرض ميشود برخي متغيرهای حذف شده عواملي هستند که خاص مقطع منفرد يا دوره زماني ميباشند در حالي که ساير متغيرها نشان دهنده تفاوتهاي فردي هستند که ميتوانند مشاهدات را براي يک فرد معين به طريق مشابه در طول زمان تحت تاثير قرار دهند، به عبارتي متغيرهاي حذف شده خاص مقطع يا دوره زماني است و متغيرهاي توضيحي داده شده کم و بيش همه افراد را تحت تاثير قرار ميدهد اشرف زاده و مهرگان (1389). بنابراين با فرض رابطه (7) به صورت زیر:

رابطه-7
Yit = α + Xitβ + Uit

جمله خطا به صورت رابطه (8) در نظر گرفته ميشود:

رابطه-8
Uit = µi + λt + Vit

λtجمله اثر زماني است و براي سادگي حذف ميشود، پس جمله خطا به صورت رابطه (9) خواهد بود
رابطه-9
Uit = µi + Vit

لذا وقتي iµ ثابت فرض شود پارامترهاي زيادي در مدل اثر ثابت وارد ميشود و درجه آزادي زيادي از بين ميرود. اگر iµ تصادفي فرض شود در اين حالتμi~iid(0 , δ^2) و Vit~iid(0 , δ^2) دارد و iµ مستقل از Vit ميباشد و علاوه بر اين Xit مستقل iµ و Vit براي تمام iها و tهاست.
مدل اثر تصادفي در صورتي تصريح مناسبي خواهد بود که N فرد به طور تصادفي از يک جامعه بزرگ استخراج شود اما حالت اثر ثابت در صورتي تصريح مناسبي تلقي خواهد شد که توجه به N فرد يا مقطع از يک جامعه مشخص باشد.
نکته مهمي که تاکيد خاصي روي آن بايد انجام داد اين است که مدل اثر تصادفي و اثر ثابت را از هم متمايز مينمايد و آن اين است که اثر خاص فردي در طول زمان ثايت است، يعني iµ با Xit ناهمبسته ميباشد. به عبارتي متغيرهاي حذف شده از مدل که اثر آنها در iµ ديده ميشود با متغيرهاي توضيحي که در مدل گنجانده شده است همبستگي ندارد و اين از ويژگيهاي نمونه تصادفي است و اثر ثابت هنگامي قابل پذيرش ميباشد که بتوان تفاوت ميان مقاطع را با تفاوت در جملات عرض از مبدا توضيح داد. به عبارتي جملات عرض از مبدا باعث ميشود رگرسيون هر مقطع جداگانه به اندازه iα انتقال پيدا کند. لذا براي تشخيص اينکه مدل در رگرسيون پانل ديتا به صورت اثر تصادفي و يا اثر ثابت تصريح شود هاسمن آزموني را ارائه کرد اشرف زاده و مهرگان (1389).

3-4-1-2- آزمون هاسمن20 براي انتخاب اثر ثابت يا اثر تصادفي
در رگرسيون جزء خطا يک فرض بسيار مهم اين است که = 0 E(Uit/Xit) باشد به عبارت ديگر جمله خطا که در بر گيرنده اثرات فردي است از متغيرهاي توضيحي مستقل است. در مدل اثر تصادفي iµ ها از Xit مستقل است. چون iµ ها در جمله خطا قرار دارند. بنابراين ميتوان در مدل اثر تصادفي فرض کرد که =0 E(Uit/Xit) است، اما در مدل اثر ثابت اين فرض ديگر برقرار نيست؛ زيرا iµ ها با Xit ها همبسته هستند. از آنجايي که به طور قاطع در مورد انتخاب مدل اثر تصادفي يا اثر ثابت قضاوت کرد. هاسمن آزموني را براي تشخيص و شناسايي درست مدل که اثر ثابت باشد يا اثر تصادفي ارائه کرده

پایان نامه
Previous Entries پایان نامه ارشد رایگان درمورد محیط زیست، زیست محیطی، درآمد سرانه، رشد اقتصادی Next Entries پایان نامه ارشد رایگان درمورد اثرات ثابت، گشتاورهای تعمیم یافته، روش حداقل مربعات، حداقل مربعات معمولی