
در غیر این صورت روش اثرات ثابت کارا است (محمد زاده و همکاران، 1389).
استفاده از رگرسيون چند متغیر ه نيازمند برقراري پيشفرضهايي است. در عمل کنترل و تحقق تمامی اين پیشفرضها نه مرسوم و نه عملی است و حتی برخی صاحبنظران کنترل و تحقق تمامی این پیشفرضها را ضروری نمیدانند (سرمد، بازرگان و حجازی، 1387).در دادههای تابلویی ( پانلی) نیز مانند دادههای سری زمانی میتوان بحثهای مربوط به ناهمسانی واریانس و همچنین خود همبستگی را مطرح نمود.
3-9-5- آزمونهای ناهمسانی واریانس،خود همبستگی و آزمون هم خطی
در صورتی که دوره زمانی مورد مطالعه در دادههای ترکیبی نسبت به تعداد واحدهای انفرادی بیشتر است، انتظار میرود بحث خود همبستگی بین اجزاء خطاء باقی ماندهموضوعیت داشته باشد و در صورتی که تعداد واحدهای انفرادی بیشتر از دوره زمانی مورد مطالعه است، میتوان انتظار داشت که اجزاء خطاء باقی ماندهدارای ناهمسانی واریانس باشند؛ لذا لازم است هر یک از این موارد مورد آزمون قرار گیرد. برای انجام آزمون ناهمسانی واریانس در داده های ترکیبی مبتنی بر روش تابلویی، بین جملات اختلال، دو مدل رگرسیون مقید و نامقید تخمین زده میشود. در مدل مقید فرض همسانی واریانس یا فرض توزیع یکسان و مستقل94 در نظر گرفته میشود در حالی که در مدل نامقید فرض بر یکسان نبودن واریانس جملات خطا بین واحدهای مقطعی (ناهمسانی واریانس) میباشد. در روش حداقل مربعات تعمیم یافته، هر دو مدل فوق تخمین زده میشوند و سپس بر اساس آماره آزمون نسبت درستنمایی95و با استفاده از رابطه زیر به آزمون فرضیه ناهمسانی واریانس پرداخته میشود.
در رابطه فوق لگاریتم راست نمایی مدل نامقید و لگاریتم راست نمایی در مدل مقید میباشد. در صورتی که پس از انجام آزمون ناهمسانی واریانس، فرضیه صفر رد گردد در آن صورت لازم است از روش حداقل مربعات تعمیم یافته96 استفاده شود (محمد زاده و همکاران، 1389).آزمون وایت، آزمونی جهت بررسی همسانی واریانس است که در داده های ترکیبی مبتنی بر روش تلفیقی استفاده میشود. در این آزمون فرضیه صفر بیانگر همسانی واریانس در اجزاء خطاء باقی ماندهمیباشد. بنابراین، هنگامی که در این آزمون فرضیه صفر رد گردد؛ میتوان استنباط نمود که در مدل برازش شده مشکل ناهمسانی واریانس وجود دارد که در این صورت باید از روش حداقل مربعات تعمیم یافته استفاده شود.
یکی دیگر از پیش فرضهای رگرسیون، عدم وجود هم خطی بین متغیر های توضیحی ( شامل متغیر های مستقل و متغیر های کنترلی) میباشد. هم خطی آزمونی است که نشان میدهد یک متغیر مستقل، تابعی خطی از سایر متغیر های مستقل است. اگر هم خطی در یک معادله رگرسیون بالا باشد، بدین معنی است که بین متغیر های مستقل، همبستگی بالایی وجود دارد و ممکن است با وجود بالا بودن R2، مدل دارای اعتبار بالایی نباشد. به عبارت دیگر، با وجود آنکه مدل خوب به نظر میرسد، ولی دارای متغیر های مستقل معنی داری نمیباشد. در پژوهش جاری برای بررسی این پیش فرض از آزمون وی ای اف97 استفاده خواهد شد.
یکی از مفروضاتی که در رگرسیون مد نظر قرار میگیرد، استقلال خطاها از یکدیگر است. این فرض از طریق آزمون دوربین – واتسون مورد بررسی قرار میگیرد. مقدار آماره این آزمون در دامنه 0 و 4 قرار میگرید. چنانچه این آماره در بازه 1.5 تا 2.5 قرار گیرد H0 آزمون (عدم همبستگی بین خطاها) پذیرفته میشود و در غیر این صورت H0 رد میشود. لازم به ذکر است که در صورت رد فرض H0، نمیتوان از آزمون رگرسیون استفاده کرد.
در ادامه مزیتهای استفاده از دادهای ترکیبی به صورت خلاصه ارایه میگردد.
3-10- مزيت استفاده از دادههاي تركيبي نسبت به سري زماني و مقطعي
الف- دادههاي تركيبي اطلاعات بيشتر، تنوع يا تغييرپذيري بيشتر، هم خطی كمتر بين متغيرها، درجات آزادي و كارايي بيشتر را فراهم ميكند. در حالی که سري زماني گرفتار هم خطی ميباشند. در دادههاي تركيبي با توجه به اينكه تركيبي از سري زماني و مقطعي ميباشد، بعد مقطعي موجب اضافه شدن تغييرپذيري يا تنوع بسيار زيادي ميشود كه با در دست داشتن اين اطلاعات ميتوان برآوردهاي معتبرتري انجام داد. مزيت عمده در دادههاي تركيبي استفاده از دادههاي گروهي است يعني دادههاي مركب از يك سري زماني از نمونههاي مقطعي بالقوه كه از نظر اطلاعات، غنيتر از نمونه مقطعي (N) خواهد بود و اگر صرفاً از سري زماني استفاده شود تنها به اندازه مشاهدات (T) خواهد بود، اما با تركيب اين دو، تعداد دادهها به اندازه تعداد مقاطع ضربدر تعداد مشاهدات (N.T) افزايش خواهد يافت كه اين امر ميتواند منجر به برآوردهاي كاراتري از پارامترها شود. مقدار F در مدل تلفيقي ميتواند بزرگتر از مدل سري زماني باشد و لذا احتمال معنيدار بودن كل رگرسيون يعني وجود متغيرهاي توضيحي در مدل تلفيقي بيشتر خواهد بود.
ب-دادههاي تركيبي امكان طراحي الگوهاي رفتاري پيچيدهتري نسبت به دادههاي مقطعي و سري زماني فراهم ميكند. براي مثال به وسیله دادههاي ترکيبي امكان بهتري براي بررسي و مدلسازي كارايي تكنيكي وجود دارد.
ج- دادههاي تركيبي امكان بيشتري براي شناسايي و اندازهگيري اثراتي را فراهم ميكند كه به وسیله فقط آمارهاي مقطعي و يا سري زماني به سادگي قابل شناسايي نيست.
د- دادههاي تركيبي از واحدهاي كوچكي مثل افراد، شركتها و خانوارها گردآوري ميشوند. خيلي از متغيرها را ميتوان در مقياس كوچك با دقت بيشتري اندازهگيري نمود و انحرافهاي ناشي از تجمع افراد يا شركتها حذف ميشوند.
امتياز ديگري كه براي تركيب كردن دادهها ميتوان در نظر گرفت اين است كه استفاده از مشاهدات مقطعي ممكن است منجر به برآوردهاي اريبي از پارامترها شود. چنانچه از اين برشهاي مقطعي طي زمان نمونهگيري شود و به اصطلاح دادههاي گروهي فراهم شود برآوردهاي نا اریب و سازگاري امكانپذير است (مرادی جز، 1391).
خلاصهي فصل
در اين فصل روششناسي، جامعه و نمونه آماري، روشهاي گردآوري اطلاعات و روشهاي آماري تجزيه و تحليل آنها، فرضيه و مدل تجربی مورد استفاده برای آزمون آن تشريح گرديد. پژوهش حاضر، از نوع پژوهشهای کاربردی است و از منظر نوع مطالعه و نحوهی گردآوري دادهها ميداني-كتابخانهاي ميباشد. اين پژوهش به بررسي رابطه بین تعداد دفعات پیش بین سود، هزینه حقوق صاحبان سهام و عدم تقارن اطلاعاتی ايران، ميپردازد. مشاهدات مورد بررسي در اين پژوهش مشتمل بر تعدادي از شرکتهای پذيرفتهشده در بورس اوراق بهادار تهران در فاصله زماني سالهاي 1389 تا 1393 میباشند.
در فصل آتی با استفاده از روشهاي اندازهگيري و مدلهای معرفی شده در این فصل و در قالب چارچوب نظري كه در فصل دو و تا حدی در فصل حاضر تبیین گرديد، فرضيه های پژوهش بر اساس دادههای گردآوری شده مورد تجزیه و تحلیل و بررسی آماری قرار خواهند گرفت.
فصل چهارم
تجزیه وتحلیل داده ها
4-1مقدمه
در فصل چهارم به بررسی الگوهای ارائه شده و تفسیر نتایج پرداخته شده است. در این مطالعه مدلهای برآورد شده براساس دادههای ترکیبی است، از اين رو ابتدا بایستی از پایا بودن متغیرها از طریق آزمونهای مانایی مختص دادههای تلفیقی اطمینان حاصل کرد و در قدم بعدی به منظور بررسی رابطه بین متغیرهای مدل، از آزمون همجمعی استفاده شده است. پس از حصول اطمینان از مانا بودن دادهها، مدلها برآورد و تفسیر شدهاند. در برآورد مدلها براساس رویکرد دادههای تلفیقی ابتدا به منظور تعیین Pool یا Panel بودن مدل از آزمون F لیمر استفاده شده است. و در مرحله بعد آزمون هاسمن به منظور تعیین روش اثرات ثابت و یا روش اثرات تصادفی انجام شده است.
4-2-آمار توصيفي
در تجزیه و تحلیل توصیفی98، پژوهشگر با استفاده از جداول و شاخصهای آمار توصیفی نظیر شاخص های مرکزی99 و پراکندگی100 به توصیف دادههای جمعآوری شده پژوهش میپردازد. این امر به شفافیت و توضیح دادههای پژوهش کمک بسیاری میکند. نتایج حاصل از تجزیه و تحلیل توصیفی دادهها در جداول (4-1)، (4-2) و (4-3) ارائه شده است.
تعداد مشاهدات پژوهش حاضر 678 شرکت است. این مشاهدات حاصل از ترکیب دادههای 110 شرکت پذیرفته شده در بورس بهعنوان دادههای مقطعی، در طول 5 سال(1389 تا 1393)، بعنوان دوره مورد مطالعه میباشد.
اصلیترین شاخص مرکزی، میانگین است که نشاندهنده نقطه تعادل و مرکز ثقل توزیع است. میانه نشان میدهد که نیمی از دادهها کمتر از این مقدار و نیمی دیگر بیشتر از این مقدار هستند. به طور کلی پارامترهای پراکندگی، معیاری برای تعیین میزان پراکندگی از یکدیگر یا میزان پراکندگی آنها نسبت به میانگین است. از مهمترین پارامترهای پراکندگی، انحراف معیار است.
جدول 4-1. میانگین و انحراف معیار نمره متغیرهای پژوهش از 1393-1389
انحراف معیار
میانگین
حداکثر
حداقل
تعداد
متغیر
210/64
362/119
1265/23
3362/21
550
تعداد دفعات پیش بینی سود مدیریت
635/36
232/436
3621/17
6251/15
550
عدم تقارن اطلاعاتی
741/29
569/612
0123/15
3264/13
550
هزینه حقوق صاحبان سهام
326/29
236/448
3625/25
6541/23
550
ارزش دفتری سهام
231/63
332/461
2136/21
1254/18
550
اهرم مالی
984/45
265/365
4512/34
2265/29
550
حجم معاملات سهام
326/38
326/2458
3265/4651
3265/42
550
اندازه شرکت
341/51
215/512
2652/35
3252/31
550
قیمت سهام
425/43
236/425
6251/20
1432/16
550
کل داراییها
236/21
336/621
2351/28
1265/26
550
تعداد دفعات سهام
4-3 آزمون ریشه واحد دادههای پانل
قبل از برآورد و بررسی مدل، ابتدا نسبت به مانایی و نامانایی دادههای مورداستفاده در مدل اطمینان حاصل میشود. اگر در تخمین معادلات اقتصادسنجی از دادههای نامانا استفاده گردد، به دلیل اینکه دادهها در طول زمان دارای واریانس و میانگین ثابت نیستند، لذا آمارههای tو Fمعتبر نیستند و مدل تخمین زده شده تورشدار و غیرقابل استفاده میباشند و با مسأله رگرسیون کاذب مواجه خواهیم شد. در اینگونه رگرسیونها، در عین حال که ممکن است هیچ رابطه معنیداری بین متغیرهای الگو وجود نداشته باشد، ضریب تعیین به دست آمده آن ممکن است بسیار بالا باشد و موجب شود که محقق به استباطهای غلطی در مورد میزان ارتباط بین متغیرها کشانیده شود.دراین تحقیق راي بررسي مانايي متغيرهابرای داده¬هایترکیبی،ازآزمون (HADRI) استفاده شده است. فرض صفردراین آزمون وجودریشه واحدیابطورمعادل،عدم مانایی متغیّرهامی باشدکه اگرمقدارp-valueکمتراز 0.05 باشدفرض صفرردميشودومتغیّرهاماناهستند. نتایج مربوط به این آزمون درجدول زیرمنعکس شده است:
جدول(4-2): نتایج آزمون مانایی متغیّرها
متغیّر
مشاهدات
p-value
550
0000/0
550
0000/0
550
0000/0
550
0000/0
550
0000/0
550
0000/0
550
0000/0
550
0000/0
550
0000/0
550
0000/0
4-3 آزمون جارکو برا ( نرمال بودن داده ها)
بسیاری از آزمون های آماری از جمله آزمون های پارامتریک برمبنای نرمال بودن توزیع داده ها بنا نهاده شده اند و با این پیش فرض بکار می رود که توزیع داده ها در یک جامعه یا در سطح نمونه های انتخاب شده از جامعه مذکور از توزیع نرمال پیروی مي نماید. بنابراین تحلیل گر لازم است تا قبل از پرداختن به تحلیل های آماری بررسی متغیر ها، نوع توزیع آن متغیر ها را بداند. بنابراین برای نرمال کردن داده ها از آزمون جارکو – برا استفاده شده است.
جدول 4-3 جارکو- برا
سطح احتمال
جارکو-برا
متغییرها
000/0
61/31
000/0
65/417
000/0
52/26
000/0
15/111
000/0
12/14
000/0
365/32
000/0
22/221
000/0
236/32
000/0
15/24
000/0
12/45
نتایج جدول نشان میدهد که میزان خطای به دست آمد برای آزمون جارک- بروااز سطح 5 درصد کمتر است یعنی طبق این آزمون فرض H0 رد می
