منبع پایان نامه ارشد درباره روش حداقل مربعات، آزمون فرضیه، انحراف معیار

دانلود پایان نامه ارشد

در غیر این صورت روش اثرات ثابت کارا است (محمد زاده و همکاران، 1389).
استفاده از رگرسيون چند متغیر ه نيازمند برقراري پيش‌فرض‌هايي است. در عمل کنترل و تحقق تمامی اين پیش‌فرض‌ها نه مرسوم و نه عملی است و حتی برخی صاحب‌نظران کنترل و تحقق تمامی این پیش‌فرض‌ها را ضروری نمی‌دانند (سرمد، بازرگان و حجازی، 1387).در داده‌های تابلویی ( پانلی) نیز مانند داده‌های سری زمانی می‌توان بحث‌های مربوط به ناهمسانی واریانس و همچنین خود همبستگی را مطرح نمود.
3-9-5- آزمون‌های ناهمسانی واریانس،خود همبستگی و آزمون هم خطی
در صورتی که دوره زمانی مورد مطالعه در داده‌های ترکیبی نسبت به تعداد واحد‌های انفرادی بیشتر است، انتظار می‌رود بحث خود همبستگی بین اجزاء خطاء باقی ماندهموضوعیت داشته باشد و در صورتی که تعداد واحدهای انفرادی بیشتر از دوره زمانی مورد مطالعه است، می‌توان انتظار داشت که اجزاء خطاء باقی ماندهدارای ناهمسانی واریانس باشند؛ لذا لازم است هر یک از این موارد مورد آزمون قرار گیرد. برای انجام آزمون ناهمسانی واریانس در داده های ترکیبی مبتنی بر روش تابلویی، بین جملات اختلال، دو مدل رگرسیون مقید و نامقید تخمین زده می‌شود. در مدل مقید فرض همسانی واریانس یا فرض توزیع یکسان و مستقل94 در نظر گرفته می‌شود در حالی که در مدل نامقید فرض بر یکسان نبودن واریانس جملات خطا بین واحدهای مقطعی (ناهمسانی واریانس) می‌باشد. در روش حداقل مربعات تعمیم یافته، هر دو مدل فوق تخمین زده می‌شوند و سپس بر اساس آماره آزمون نسبت درستنمایی95و با استفاده از رابطه زیر به آزمون فرضیه ناهمسانی واریانس پرداخته می‌شود.

در رابطه فوق لگاریتم راست نمایی مدل نامقید و لگاریتم راست نمایی در مدل مقید می‌باشد. در صورتی که پس از انجام آزمون ناهمسانی واریانس، فرضیه صفر رد گردد در آن صورت لازم است از روش حداقل مربعات تعمیم یافته96 استفاده شود (محمد زاده و همکاران، 1389).آزمون وایت، آزمونی جهت بررسی همسانی واریانس است که در داده های ترکیبی مبتنی بر روش تلفیقی استفاده می‌شود. در این آزمون فرضیه صفر بیانگر همسانی واریانس در اجزاء خطاء باقی ماندهمی‌باشد. بنابراین، هنگامی که در این آزمون فرضیه صفر رد گردد؛ می‌توان استنباط نمود که در مدل برازش شده مشکل ناهمسانی واریانس وجود دارد که در این صورت باید از روش حداقل مربعات تعمیم یافته استفاده شود.
یکی دیگر از پیش فرض‌های رگرسیون، عدم وجود هم خطی بین متغیر های توضیحی ( شامل متغیر های مستقل و متغیر های کنترلی) می‌باشد. هم خطی آزمونی است که نشان می‌دهد یک متغیر مستقل، تابعی خطی از سایر متغیر های مستقل است. اگر هم خطی در یک معادله رگرسیون بالا باشد، بدین معنی است که بین متغیر های مستقل، همبستگی بالایی وجود دارد و ممکن است با وجود بالا بودن R2، مدل دارای اعتبار بالایی نباشد. به عبارت دیگر، با وجود آنکه مدل خوب به نظر می‌رسد، ولی دارای متغیر های مستقل معنی داری نمی‌باشد. در پژوهش جاری برای بررسی این پیش فرض از آزمون وی ای اف97 استفاده خواهد شد.
یکی از مفروضاتی که در رگرسیون مد نظر قرار میگیرد، استقلال خطاها از یکدیگر است. این فرض از طریق آزمون دوربین – واتسون مورد بررسی قرار می‌گیرد. مقدار آماره این آزمون در دامنه 0 و 4 قرار میگرید. چنانچه این آماره در بازه 1.5 تا 2.5 قرار گیرد H0 آزمون (عدم همبستگی بین خطاها) پذیرفته می‌شود و در غیر این صورت H0 رد می‌شود. لازم به ذکر است که در صورت رد فرض H0، نمی‌توان از آزمون رگرسیون استفاده کرد.
در ادامه مزیت‌های استفاده از دادهای ترکیبی به صورت خلاصه ارایه می‌گردد.
3-10- مزيت استفاده از داده‌هاي تركيبي نسبت به سري زماني و مقطعي
الف- داده‌هاي تركيبي اطلاعات بيشتر، تنوع يا تغييرپذيري بيشتر، هم خطی كمتر بين متغيرها، درجات آزادي و كارايي بيشتر را فراهم مي‏كند. در حالی که سري زماني گرفتار هم خطی مي‌باشند. در داده‌‌هاي تركيبي با توجه به اينكه تركيبي از سري زماني و مقطعي مي‌باشد، بعد مقطعي موجب اضافه شدن تغييرپذيري يا تنوع بسيار زيادي مي‌شود كه با در دست داشتن اين اطلاعات مي‌توان برآوردهاي معتبرتري انجام داد. مزيت عمده در داده‌‌هاي تركيبي استفاده از داده‌هاي گروهي است يعني داده‌هاي مركب از يك سري زماني از نمونه‌هاي مقطعي بالقوه كه از نظر اطلاعات، غني‌تر از نمونه مقطعي (N) خواهد بود و اگر صرفاً از سري زماني استفاده شود تنها به اندازه مشاهدات (T) خواهد بود، اما با تركيب اين دو، تعداد داده‌ها به اندازه تعداد مقاطع ضربدر تعداد مشاهدات (N.T) افزايش خواهد يافت كه اين امر مي‌تواند منجر به برآوردهاي كاراتري از پارامترها شود. مقدار F در مدل تلفيقي مي‌تواند بزرگ‌تر از مدل سري زماني باشد و لذا احتمال معني‌دار بودن كل رگرسيون يعني وجود متغيرهاي توضيحي در مدل تلفيقي بيشتر خواهد بود.
ب-داده‌هاي تركيبي امكان طراحي الگوهاي رفتاري پيچيده‌تري نسبت به داده‌هاي مقطعي و سري زماني فراهم مي‌كند. براي مثال به وسیله دادههاي ترکيبي امكان بهتري براي بررسي و مدل‌سازي كارايي تكنيكي وجود دارد.
ج- داده‌هاي تركيبي امكان بيشتري براي شناسايي و اندازه‌گيري اثراتي را فراهم مي‌كند كه به وسیله فقط آمارهاي مقطعي و يا سري زماني به سادگي قابل شناسايي نيست.
د- داده‌هاي تركيبي از واحدهاي كوچكي مثل افراد، شركت‏ها و خانوارها گردآوري مي‌شوند. خيلي از متغيرها را مي‌توان در مقياس كوچك با دقت بيشتري اندازه‌گيري نمود و انحراف‌هاي ناشي از تجمع افراد يا شركت‏ها حذف مي‌شوند.
امتياز ديگري كه براي تركيب كردن داده‌ها مي‌توان در نظر گرفت اين است كه استفاده از مشاهدات مقطعي ممكن است منجر به برآوردهاي اريبي از پارامترها شود. چنانچه از اين برش‏هاي مقطعي طي زمان نمونه‌گيري شود و به اصطلاح داده‌هاي گروهي فراهم شود برآوردهاي نا اریب و سازگاري امكانپذير است (مرادی جز، 1391).

خلاصه‌ي فصل
در اين فصل روش‌شناسي، جامعه و نمونه آماري، روش‌هاي گردآوري اطلاعات و روش‌هاي آماري تجزيه و تحليل آن‌ها، فرضيه‌ و مدل‌ تجربی مورد استفاده برای آزمون آن‌ تشريح گرديد. پژوهش حاضر، از نوع پژوهش‌های کاربردی است و از منظر نوع مطالعه و نحوه‌ی گردآوري داده‌ها ميداني-كتابخانه‌اي مي‌باشد. اين پژوهش به بررسي رابطه بین تعداد دفعات پیش بین سود، هزینه حقوق صاحبان سهام و عدم تقارن اطلاعاتی ايران، مي‌پردازد. مشاهدات مورد بررسي در اين پژوهش مشتمل بر تعدادي از شرکت‌های پذيرفته‌شده در بورس اوراق بهادار تهران در فاصله زماني سال‌هاي 1389 تا 1393 می‌باشند.
در فصل آتی با استفاده از روش‌هاي اندازه‌گيري و مدل‌های معرفی شده در این فصل و در قالب چارچوب نظري كه در فصل دو و تا حدی در فصل حاضر تبیین گرديد، فرضيه‌ های پژوهش بر اساس داده‌های گردآوری شده مورد تجزیه و تحلیل و بررسی آماری قرار خواهند گرفت.

فصل چهارم
تجزیه وتحلیل داده ها

4-1مقدمه
در فصل چهارم به بررسی الگوهای ارائه شده و تفسیر نتایج پرداخته شده است. در این مطالعه مدلهای برآورد شده براساس دادههای ترکیبی است، از اين رو ابتدا بایستی از پایا بودن متغیرها از طریق آزمونهای مانایی مختص دادههای تلفیقی اطمینان حاصل کرد و در قدم بعدی به منظور بررسی رابطه بین متغیرهای مدل، از آزمون همجمعی استفاده شده است. پس از حصول اطمینان از مانا بودن دادهها، مدلها برآورد و تفسیر شدهاند. در برآورد مدلها براساس رویکرد دادههای تلفیقی ابتدا به منظور تعیین Pool یا Panel بودن مدل از آزمون F لیمر استفاده شده است. و در مرحله بعد آزمون هاسمن به منظور تعیین روش اثرات ثابت و یا روش اثرات تصادفی انجام شده است.
4-2-آمار توصيفي
در تجزیه و تحلیل توصیفی98، پژوهشگر با استفاده از جداول و شاخصهای آمار توصیفی نظیر شاخص های مرکزی99 و پراکندگی100 به توصیف دادههای جمعآوری شده پژوهش میپردازد. این امر به شفافیت و توضیح دادههای پژوهش کمک بسیاری میکند. نتایج حاصل از تجزیه و تحلیل توصیفی دادهها در جداول (4-1)، (4-2) و (4-3) ارائه شده است.
تعداد مشاهدات پژوهش حاضر 678 شرکت است. این مشاهدات حاصل از ترکیب داده‌های 110 شرکت پذیرفته شده در بورس بهعنوان دادههای مقطعی، در طول 5 سال(1389 تا 1393)، بعنوان دوره مورد مطالعه میباشد.
اصلیترین شاخص مرکزی، میانگین است که نشاندهنده نقطه تعادل و مرکز ثقل توزیع است. میانه نشان میدهد که نیمی از دادهها کمتر از این مقدار و نیمی دیگر بیشتر از این مقدار هستند. به طور کلی پارامترهای پراکندگی، معیاری برای تعیین میزان پراکندگی از یکدیگر یا میزان پراکندگی آنها نسبت به میانگین است. از مهمترین پارامترهای پراکندگی، انحراف معیار است.

جدول 4-1. میانگین و انحراف معیار نمره متغیرهای پژوهش از 1393-1389
انحراف معیار
میانگین
حداکثر
حداقل
تعداد
متغیر
210/64
362/119
1265/23
3362/21
550
تعداد دفعات پیش بینی سود مدیریت
635/36
232/436
3621/17
6251/15
550
عدم تقارن اطلاعاتی
741/29
569/612
0123/15
3264/13
550
هزینه حقوق صاحبان سهام
326/29
236/448
3625/25
6541/23
550
ارزش دفتری سهام
231/63
332/461
2136/21
1254/18
550
اهرم مالی
984/45
265/365
4512/34
2265/29
550
حجم معاملات سهام
326/38
326/2458
3265/4651
3265/42
550
اندازه شرکت
341/51
215/512
2652/35
3252/31
550
قیمت سهام
425/43
236/425
6251/20
1432/16
550
کل داراییها
236/21
336/621
2351/28
1265/26
550
تعداد دفعات سهام

4-3 آزمون ریشه واحد دادههای پانل
قبل از برآورد و بررسی مدل، ابتدا نسبت به مانایی و نامانایی دادههای مورداستفاده در مدل اطمینان حاصل میشود. اگر در تخمین معادلات اقتصادسنجی از دادههای نامانا استفاده گردد، به دلیل اینکه دادهها در طول زمان دارای واریانس و میانگین ثابت نیستند، لذا آمارههای tو Fمعتبر نیستند و مدل تخمین زده شده تورشدار و غیرقابل استفاده میباشند و با مسأله رگرسیون کاذب مواجه خواهیم شد. در اینگونه رگرسیونها، در عین حال که ممکن است هیچ رابطه معنیداری بین متغیرهای الگو وجود نداشته باشد، ضریب تعیین به دست آمده آن ممکن است بسیار بالا باشد و موجب شود که محقق به استباطهای غلطی در مورد میزان ارتباط بین متغیرها کشانیده شود.دراین تحقیق راي بررسي مانايي متغيرهابرای داده¬هایترکیبی،ازآزمون (HADRI) استفاده شده است. فرض صفردراین آزمون وجودریشه واحدیابطورمعادل،عدم مانایی متغیّرهامی باشدکه اگرمقدارp-valueکمتراز 0.05 باشدفرض صفرردميشودومتغیّرهاماناهستند. نتایج مربوط به این آزمون درجدول زیرمنعکس شده است:

جدول(4-2): نتایج آزمون مانایی متغیّرها
متغیّر
مشاهدات
p-value

550
0000/0

550
0000/0

550
0000/0

550
0000/0

550
0000/0

550
0000/0

550
0000/0

550
0000/0

550
0000/0

550
0000/0

4-3 آزمون جارکو برا ( نرمال بودن داده ها)
بسیاری از آزمون های آماری از جمله آزمون های پارامتریک برمبنای نرمال بودن توزیع داده ها بنا نهاده شده اند و با این پیش فرض بکار می رود که توزیع داده ها در یک جامعه یا در سطح نمونه های انتخاب شده از جامعه مذکور از توزیع نرمال پیروی مي نماید. بنابراین تحلیل گر لازم است تا قبل از پرداختن به تحلیل های آماری بررسی متغیر ها، نوع توزیع آن متغیر ها را بداند. بنابراین برای نرمال کردن داده ها از آزمون جارکو – برا استفاده شده است.

جدول 4-3 جارکو- برا

سطح احتمال
جارکو-برا
متغییرها
000/0
61/31

000/0
65/417

000/0
52/26

000/0
15/111

000/0
12/14

000/0
365/32

000/0
22/221

000/0
236/32

000/0
15/24

000/0
12/45

نتایج جدول نشان میدهد که میزان خطای به دست آمد برای آزمون جارک- بروااز سطح 5 درصد کمتر است یعنی طبق این آزمون فرض H0 رد می

پایان نامه
Previous Entries منبع پایان نامه ارشد درباره اثرات ثابت، داده های ترکیبی، نرخ بیکاری Next Entries منبع پایان نامه ارشد درباره عدم تقارن اطلاعات، عدم تقارن اطلاعاتی، عدم تقارن