
بعد ظهر که بازار بسته میشود و 8 صبح که بازار باز میشود وجود نداشته باشد؛ در روز بعد وقتی بازار دوباره بازگشای میشود، معمولاً فعالیت کمتری در هنگام باز و بسته شدن بازار نسبت به معاملات در نزدیکی ظهر در بازار وجود داشته باشد. اگرچه روشهای متعددی بهمنظور مواجهه با این شرایط وجود دارد اما یک روش ساده، انتخاب و استفاده از یک فراوانی مناسب برای آن دوره زمانی بر اساس آخرین قیمت در خلال فاصله زمانی میباشد.
عموماً لازم است تمامی دادههای مورد استفاده در یک مدل، دارای فراوانی مشاهدات یکسانی باشد. به عنوان مثال در مدلهای رگرسیونی که به دنبال تخمین مدل قیمتگذاری آربیتراژ بر اساس مشاهدات ماهانه عوامل کلان اقتصادی است، حتی در صورت وجود مشاهدات روزانه و هفتگی، باید از دادههای ماهانه بازده سهام استفاده کرد. همچنین دادهها میتواند به صورت کمی (مانند نرخهای ارز، قیمتها، تعداد سهام در جریان) و یا کیفی ( مانند روزهای هفته، رتبهبندی اعتباری و نظایر آن) باشد.
3-5-2-2- دادههای مقطعی
دادههای مقطعی دادهای هستند که برای یک یا چند متغیر در یک نقطه از زمان جمعآوری میشوند.بهعنوانمثال ممکن است این دادهها شامل موارد ذیل باشد:
نظرسنجی در مورد کاربرد خدمات اینترنتی در کارگزاریهای سهام
بازده سهام در بورس اوراق بهادار در مقطعی از زمان
رتبه اعتباری اوراق قرضه
3-4-2-3- دادهها از نوع پانل
دادههای پانل دارای دو بُعد دادههای سری زمانی و دادههای مقطعی است. بهعنوانمثال قیمت روزانه تعدادی از سهام جذاب در طول دو سال از نوع دادههای پانل است.
X
Y
مقطع (i)
زمان (t)
N … 2 1
N … 2 1
X_N1 … X_21 X_11
X_N2 … X_22 X_12
⋮ ⋮ ⋮ ⋮
X_NT … X_2T X_1T
Y_N1 … Y_21 Y_11
؛_N2 … Y_22 Y_12
⋮ ⋮ ⋮ ⋮
Y_NT … Y_2T Y_1T
1
2
⋮
T
جدول 3-5 نحوه واردکردن اطلاعات درروش پانل حالت دوم
X_it
Y_it
زمان (t)
مقطع (i)
X_11
X_12
⋮
X_1T
Y_11
Y_12
⋮
Y_1T
1
2
⋮
T
1=i
X_21
X_22
⋮
X_2T
Y_21
Y_22
⋮
Y_2T
1
2
⋮
T
2=i
⋮
⋮
⋮
⋮
X_N1
X_N2
⋮
X_NT
Y_N1
Y_N2
⋮
Y_NT
1
2
⋮
T
n=i
جدول 3-6 نحوه وارد کردن اطلاعات در روش پانل حالت اول
3-5-3- پانل دیتا274
در آمار و اقتصاد سنجی، مجموعه دادههای پانلی شامل مشاهداتی برای چندین بخش(خانوار، بنگاه و…) میباشند که در طی زمانهای مختلف جمع آوری شدهاند. یعنی یک مدل دادههای پانل حاوی اطلاعاتی در زمان و مکان است که شامل N مؤلفه در T دوره زمانی میباشد.
اگر تعداد مشاهدات زمانی برای تمام مؤلفههای موجود در پانل یکسان باشد، به آن پانل متوازن275 گفته میشود. اما در صورتی که مشاهدات مفقودهای برای تعدادی از مؤلفهها وجود داشته باشد، پانل را نامتوازن مینامیم.
3-5-3-1- مزایای دادههای پانل
طبق اصل جامعیت آماری ما باید از همه اطلاعات در دسترس برای انجام رگرسیون استفاده نمایید. استفاده از دادههای پانل باعث میشود حجم نمونه بسیار بیشتر شود. این دادهها مخصوصاً در کشورهای در حال توسعه که روش جمعآوری دادههای آنها منظم نیست کاربرد بیشتری دارد. استفاده از دادههای پانل مزایای دارد که چند مورد آن به شرح زیر است :
کاهش هم خطی موجود بین متغیرها: زیرا یکی از روشهای کاهش هم خطی افزایش حجم نمونه است که با توجه به اینکه در دادههای پانل حجم نمونه زیاد میشود ممکن است هم خطی کاهش یابد.
افزایش واریانس متغیرها که منجر به کاهش واریانس پارامترهای برآوردی میشود.
خلاصی از بسیاری از متغیرهای غیرقابل مشاهده بدون اینکه مشکل زیادی به وجود آید. این ویژگی یکی از ویژگیهای جالب مدلهای پانل دیتا است. با وجود مزایای زیادی که دادههای پانل دارد اگر فردی که تجربه و آشنایی کافی با پانل دیتا ندارد به استفاده از این داده ها همت گمارد احتمالاً نتایج غلط و عجیبی خواهد گرفت. غالباً بسیاری از دانشجویان و اساتیدی که از دادههای پانل استفاده میکنند و از ادبیات دادههای پانل اطلاع ندارند بسیار سطحی به برآورد مدل میپردازند .
مخصوصاً عدم لحاظ تمام ناهمگنیها باعث برآوردهای تورش دار و ناسازگار خواهد شد. در بسیاری از تحقیقات داخلی که از دادههای پانل استفاده نمودهاند تنها به آزمون چاو276 و آزمون هاسمن بسنده نمودهاند که این آزمونها قطعاً جهت دستیابی به نتایج صحیح کافی نیست . محققی که از دادههای پانل استفاده مینماید ابتدا باید با توجه نوع پانل (میکرو یا ماکرو) مسائلی که در هرکدام ممکن است اتفاق افتد را مورد بررسی قرار دهد. مسائل عمدهای که در دادههای ماکرو پانل اتفاق میافتد عبارتاند از: غیر ایستایی، هم جمعی، شکست ساختاری و همبستگی بین مقاطع در میکرو پانل معمولاً خطای اندازهگیری ،اثر ثابت و اثر تصادفی مطرح میشود. در میکرو پانل اگر یک قسمت خاص را مورد توجه قرار دهیم مدل اثر ثابت مناسبتر خواهد بود . اما اگر در موقعی که تعداد مقاطع زیاد و تعداد سالها کم باشد از مدل اثر ثابت استفاده نماییم درجه آزادی زیادی از دست میرود. آزمون چاو که به وسیله بسیاری از محققان استفاده میشود وجود اثر ثابت را در مقابل پولینگ تست مینماید. حال سؤال این است که اگر اثر تصادفی در متغیرهای وجود داشته باشد آیا آزمون چاو معتبر است. به آسانی میتوان اثبات نمود که در این حالت آزمون چاو اعتبار لازم را نخواهد داشت، همچنین در خصوص وجود مشکل ناهمسانی واریانس و خودهمبستگی در دادههای پانل باید گفت چنانچه تعداد سالها بیشتر از مقاطع باشد مشکل خودهمبستگی و چنانچه تعداد مقاطع بیشتر از سالها باشد مسئله ناهمسانی مورد انتظار است.
3-5-3-2- مدل اثرات ثابت
در این مدل هر یک از مولفهها یک مقدار ثابت مخصوص به خود دارد و به دلیل آنکه برای کار کردن با هر یک از این مقادیر ثابت، یک متغیر مجازی در نظر گرفته می شود، تخمین زن اثرات ثابت، تخمین زن متغیرهای مجازی حداقل مربعات(LSDV) نیز نامیده می شود. این مدل را می توان به شکل زیر نوشت:
Y=Dα+Xβ+ u (3-36)
که در آن D ماتریس متغیرهای مجازی با ابعاد NT*N و X ماتریس متغیرهای توضیحی با ابعاد NT*k و β نیز ماتریس ضرایب با ابعاد k*1 می باشند.
مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست و می توان مدل را با استفاده از OLS برآورد کرد.
مزیت مدل با اثرات ثابت این است که می تواند اثراتی را که در هر یک از مؤلفهها متفاوت است ولی در طول زمان تغییر نمیکند، نشان دهد. البته پس از تشکیل مدل دیگر نمی توان به آن متغیری افزود که در طول زمان تغییر نکند، چرا که با اثرات ثابت موجود همخطی کامل پیدا خواهد کرد. از سوی دیگر عیب چنین مدلی این است که در آن باید برای هریک از متغیرهای مجازی یک ضریب و در مجموع N ضریب تخمین زد. این امر هنگامی که تعداد مؤلفهها یعنی N خیلی زیاد باشد، که معمولاً نیز چنین است، مسئله ساز خواهد شد.
برای برطرف کردن این مشکل یک راه آن است که میانگین زمانی هر یک از متغیرها را از مقدار اصلی آنها کم کنیم. با این کار به مدلی می رسیم که فاقد عرض از مبدأ خواهد بود و می توانیم روش حداقل مربعات معمولی رابرای آن اجرا کنیم. روش دیگر آن است که تفاضل مرتبه اول متغیرها را به جای آنها در مدل به کار ببریم. در این صورت نیز عرض از مبدأ از مدل حذف میشود و مشکل تعداد زیاد پارامترها برای تخمین نیز برطرف می گردد.
3-5-3-3- روش پانل پویای گشتاورهای تعمیم یافته
بسیاری از مدلهای دادههای پانل در اصل، پویا میباشند و لحاظ این پویایی در مدلهای پانل به صحت و استحکام نتایج به دست آمده کمک خواهد نمود. روش گشتاور تعميم يافته يكي از روشهای برآورد پارامترهاي مدل در رهيافت دادههاي تابلويي پويا بوده كه قابل استفاده براي دادههاي سري زماني، مقطعي و دادههاي تابلويي است. در مدلهای پانل با ورود وقفههای متغیر وابسته به عنوان متغیر مستقل در سمت راست مدل، فرم پویای مدل حاصل میگردد. روش پانل پویای گشتاورهای تعمیم یافته زمانی کاربرد دارد که در دادههای پانل تعداد مقاطع بیشتر از تعداد سریهای زمانی باشد (بالتاگی277، 2008). در این مقاله نیز تعداد مقاطع 153 و تعداد سالهای سری زمانی 13 میباشد. برآورد گشتاورهای تعمیم یافته (GMM) برآوردگر پرتوانی است که برخلاف روش حداکثر درستنمایی (ML) نیاز به اطلاعات دقیق توزیع جملات اختلال ندارد (مشکی، 1390).
وجود وقفه متغیر وابسته در سمت راست مدل پانل منجر میشود که فرض عدم خودهمبستگی میان متغیرهای مستقل (توضیحی) و جملات اختلال به عنوان یکی از فروض کلاسیک نقض شود. درنتیجه استفاده از روشهای حداقل مربعات معمولی (در مدل پانل اثرات ثابت و اثرات تصادفی) نتایج تورشدار و ناسازگاری ارائه خواهد کرد (آرلانو278 و باند279، 1991). استفاده از روش تعمیمیافته گشتاورها (GMM) با بکارگیری متغیرهای ابزاری این ایراد یعنی درونزایی متغیرهای توضیحی یا ساختار پویای مدل را برطرف مینماید و جهت حذف تورش ناشی از درونزایی متغیرهای توضیحی، اجازه میدهد تمام متغیرهای رگرسیونی حتی با وقفه، اگر همبستگی با اجزاء اخلال ندارد به عنوان متغیر ابزاری وارد مدل شوند (گرین280، 2012).
ماتیاس281 و سوستر282 (1991) که روش حداقل مربعات دومرحلهای اندرسون283 و هسیائو284 (1981) که به منظور رفع مشکل همبستگی جملات اختلال و متغیرهای توضیحی ارایه شده است به دلیل مشکل در انتخاب ابزارها، منجر به محاسبه واریانس بزرگ برای برآوردگرها و عدم معنیداری آنها خواهد شد (یاوری، اشرافزاده، 1384). برای حل این مشکل روش گشتاورهای تعمیم یافته آرلانو و باند (1991) پیشنهاد شد. این روش به واسطه انتخاب ابزارهای صحیح و با اعمال یک ماتریس وزنی میتواند برای شرایط ناهمسانی واریانس و نیز خودهمبستگیهای ناشناخته برآوردگر پرتوانی محسوب شود (مشکی، 1390). همچنین کاربرد روش گشتاورهای تعمیم یافته (GMM) با دادههای پانل پویا (DPD)285 مزیتهایی مانند لحاظ نمودن ناهمسانی انفرادی، حذف تورشها در رگرسیونهای مقطعی و درنتیجه برآوردگرهایی با کارایی بالاتر و همخطی کمتر خواهد بود (ندیری، محمدی، 1390).
روش تفاضلی مرتبه اول گشتاورهای تعمیمیافته (GMM) ابتدا توسط آرلانو و باند (1998) مطرح شد. در روش تفاضلی مرتبه اول آرلانو و باند ابتدا وقفه متغیر وابسته به سمت راست اضافه میشود، سپس از متغیرها تفاضل مرتبه اول گرفته میشود و مدل به روش برابر قرار دادن گشتاورهای اولیه و مرکزی در نمونه و جامه مورد برآورد قرار میگیرد (پارسیان، 1389). در این روش عرض از مبداء حذف میگردد (یاوری، اشرافزاده، 1384). آرلانو و باور286 (1995) و بوندل287 و بوند (1998) با لحاظ تغییراتی در روش تفاضلی مرتبه اول گشتاورهای تعمیمیافته (GMM) روش گشتاورهای تعمیمیافته (GMM) متعامد را پیشنهاد دادند. تفاوت این دو روش یعنی آرلانو- بوند و آرلانو- باور/ بوندل-باند بر اساس شیوهای است که تاثیرات فردی288 در مدل لحاظ میشود (ندیری، محمدی، 1391). از مزایای روش دوم بر روش اول افزایش دقت و کاهش تورش محدودیت حجم نمونه، تخمینهای کارآمدتر و دقیقتر میباشد (بالتاگی، 2008).
برای تخمین مدل پانل با ویژگیهای ذکر شده از تخمینزن پانل پویای تعمیمیافته (DPD) به روش آرلانو- باور/ بوندل- باند دو مرحلهای289 بهره خواهیم برد. به منظور تصریح مدل فوق و استخراج برآوردگرهایروش آرلانو- باور/ بوندل- باند دو مرحلهای یک مدل پانل پویا (DPD) به صورت زیر درنظر بگیرید (آلرانو، 2003):
y_it=∑_(j=1)^p▒〖α_i y_(i,t-j)+x_it β_1+ν_i+ε_it 〗 (3-37)
α_i : تعداد p پرامتر که باید برآورد گردند.
x_it : یک بردار 1×k_1 از متغیرهای کاملا برونزا290
