منابع پایان نامه ارشد درمورد اثرات ثابت، رگرسیون، روش حداقل مربعات، رگرسیون خطی

دانلود پایان نامه ارشد

زماني و يا داده‌هاي مقطعي مي‌باشد. به‌عنوان‌مثال، كارايي فني در این‌گونه از مدل‌ها بهتر مطالعه و تصريح مي‌شود. همچنين محدوديت‌هايي كه در مطالعات سري‌هاي زماني بر روي مدل‌هاي با وقفه توزيعي اعمال مي‌شوند نيز در مدل‌هاي پانل كمتر مي‌باشد.
در محاسبه واريانس جامعه با توجه به مشاهدات مربوط به سري زماني، واريانس به دست آمده از مشاهدات بر تعداد داده‌ها منهاي تعداد پارامترها تقسيم می‌شود (همان منبع).
(3-1)
در حالی که در داده‌های تلفيقي داريم:
(3-2)
که معمولاً در اين حالت مخرج بزرگ‌تر شده و بنابراين واريانس محاسبه شده کوچک‌تر از واريانس به دست آمده از داده‌های سري زماني صرف می‌باشد و بنابراين کارآيي تخمين افزايش می‌یابد.
به همين قياس چنانچه آزمون (آزمون معنی‌دار بودن کل رگرسيون) را در دو حالت، يعني سري زماني و تلفيقي مقايسه کنيم خواهيم داشت:
در مدل سري زماني تنها:
(3-3)
درصورتی‌که در مدل تلفيقي به صورت زير محاسبه می‌گردد:
(3-4)
به‌وضوح مشخص است که مقدار در مدل تلفيقي می‌تواند بزرگ‌تر از مدل سري زماني باشد، لذا احتمال معنی‌دار بودن کل رگرسيون يعني وجود متغيرهايي توضيحي در مدل تلفيقي بيشتر خواهد بود.
مطالعه مشاهدات به صورت پانل ديتا، وضعيت بهتري براي مطالعه و بررسي پويايي تغييرات نسبت به سري زماني و داده‌هاي مقطعي دارد.
روش Pooling Data مي‌تواند اثراتي كه به‌سادگی توسط سري زماني و داده‌هاي مقطعي آشكار نمي‌شوند را اندازه‌گيري ‌كند.
روش Pooling Data ما را قادر مي‌سازد تا مشكل‌ترين مدل‌هاي رفتاري پيچيده را مطالعه كنيم. به‌طور مثال صرفه‌هاي اقتصادي و تغييرات تكنيكي بهتر مي‌تواند توسط پانل ديتا بررسي و آزمون شوند.
Pooling Data از طريق فراهم كردن تعداد داده‌هاي زياد (چندين هزار) تورش را پايين مي‌آورد (همان منبع).
3-6-2- مدل كلي داده‌هاي تابلويي
در اينجا با ارائه يک مثال کلي به توضيح داده‌های پانل می‌پردازیم، فرض کنيم که واحد تصميم مجزا وجود دارد كه با شاخص i از 1 تا شماره‌گذاري مي‌شوند همچنين دوره زماني متوالي كه با شاخص از 1 تا شماره‌گذاري مي‌شوند وجود دارد. بنابراين، مجموع مشاهده خواهيم داشت. متغيرها عبارت‌اند از:
: ارزش متغير وابسته براي واحدi ام در دوره tام.
: ارزش متغير توضيحي jام براي واحد iام در دوره tام.

رگرسيون خطي اين پانل، عبارت است از:
(3-5)
در اين رگرسيون دستگاه عمومي پارامترهاي تمام واحدها در تمام زمان‌ها بيان گرديده است. يكي از معمولي‌ترين اشكال سازمان‌دهي داده‌ها در رابطه (3-5) براساس واحدهاي تصميم‌گيري است. بنابراين داريم:
(3-6)
همچنين داده‌ها مي‌توانند به شكل انباشته به صورت زير بيان گردند:
(3-7)
به‌طوري كه Y داراي رتبه 1×n، X داراي رتبه k×n و e داراي رتبه 1×n مي‌باشد. همچنين ممكن است رابطه (3-5) به صورت زير بيان گردد:
(3-8)
به‌طوري كه i يك بردار 1×n از واحدها، اسكالر و مي‌باشند. اختلاف بين مقاطع (بنگاه‌ها، كشورها، مسيرها، استان‌ها و …) در نشان داده مي‌شود و در طول زمان ثابت فرض مي‌گردد. اگر فرض ما اين باشد كه براي تمام بنگاه‌ها ثابت است، روش OLS تخمين‌هاي كارا و سازگاري از به دست خواهد داد. ولي اگر فرض كنيم كه در بين مقاطع مختلف اختلاف وجود دارد، بايد از روش‌های ديگري براي تخمين استفاده شود.
اگر مشاهدات مربوط به تک‌تک مقاطع در دوره‌هاي يكسان و ثابت قرار داشته باشد (يعني تعداد مشاهدات هريك از آن‌ها باهم برابر باشند) در اين حالت مي‌گوييم كه پانل تعادلي است. ولي اگر مشاهدات مربوط به تک‌تک مقاطع باهم متفاوت و در دوره‌هاي مختلفي نيز باشند، هرچند ممكن است تعداد مشاهدات يكسان باشد، اما چون در دوره‌هاي متفاوت هستند به اين حالت پانل غيرتعادلي مي‌گويند (همان منبع).
3-6-3- تخمین زن‌های اثرات ثابت و تصادفي
برآورد روابطي كه در آن‌ها از داده‌هاي پانل (مقطعي ـ سري زماني) استفاده مي‌شود، غالباً با پيچيدگي‌هايي مواجه است. فرض مي‌شود جمله اختلال داراي ميانگين صفر و واريانس ثابت است. پارامترهاي مجهول مدل هستند كه واكنش متغير وابسته نسبت به تغييرات kامين متغير مستقل در iامين مقطع را در زمان t اندازه‌گيري مي‌كند. در حالت كلي فرض مي‌شود كه اين ضرايب در ميان تمامي واحدهاي مقطعي و زماني مختلف متفاوت است، ولي در بسياري از مطالعات پژوهشي متغير بودن اين ضرايب، هم براي تمامي مقاطع و هم براي تمامي زمان‌ها محدودکننده است و پژوهشگر خود بايد نسبت به ماهيت موضوع مورد مطالعه و ساير شرايط، فرض‌هاي مقتضي را در خصوص پارامترها تعيين كند.
مدل خطي پانل (3-11) را مي‌توان به پنج حالت تقسيم كرد:
1- تمامي ضرايب ثابت‌اند و فرض مي‌شود كه جمله اخلال قادر است تمام تفاوت‌هاي ميان واحدهاي مقطعي و زمان را دريافت كند و توضيح دهد.
(3-9)
2- ضرايب مربوط به متغيرها (شيب‌ها) ثابت‌اند و تنها عرض از مبدأ براي واحدهاي مختلف مقطعي متفاوت است.
(3-10)
3- ضرايب مربوط به متغيرها (شيب‌ها) ثابت‌اند و تنها عرض از مبدأ در زمان‌ها و واحدهاي مختلف مقطعي تغيير مي‌كند.
(3-11)
4- همه ضرايب براي تمام واحدهاي مقطعي متفاوت است.
(3-12)
5- تمام ضرايب هم نسبت به زمان هم نسبت به واحدهاي مقطعي متفاوت است.
(3-13)
اين پنج مورد در دو قالب كلي مدل‌هاي اثرات ثابت94 و اثرات تصادفي95 قابل بيان و بررسي مي‌باشند. به‌طور كلي در مدل‌هاي نوع اول (اثرات ثابت) فرض مي‌شود كه اختلاف ميان واحدها مي‌تواند در عرض از مبدأ خود را نشان دهد. بنابراين هر واحد مي‌تواند داراي يك جزء عرض از مبدأ باشد كه تخمين زده مي‌شود؛ اما در مدل‌هاي نوع دوم (اثرات تصادفي) برخلاف مدل‌هاي نوع اول كه فرض مي‌كنند تفاوت ميان واحدها سبب انتقال تابع رگرسيون مي‌شود و به عناصر خارج از مدل توجهي نمي‌نمايند، جزء عرض از مبدأ را داراي توزيع تصادفي مي‌داند. طبعاً بايد حجم نمونه به‌اندازه كافي بزرگ باشد تا بتوان چنين فرضي را در نظر گرفت. لذا جزء عرض از مبدأ در اين مدل داراي يك قسمت ثابت و يك قسمت تصادفي مي‌باشد و فروض حاكم بر اين جزء تصادفي شبيه فروض حاكم بر جزء اخلال بوده و اين دو، جزء اخلال جديدي به وجود مي‌آورند (همان منبع).
3-6-4- آزمونF
آنچه به‌طور كلي در مدل‌هاي پانل مطرح مي‌گردد اين است كه فرضاً واحد تصميم مجزا وجود دارند كه با شاخص i از 1 تا شماره‌گذاري مي‌شوند و همچنين دوره زماني متوالي وجود دارد كه در مجموع مشاهده خواهيم داشت. اگر رگرسيون خطي پانل، به صورت زير باشد:
(3-14)
متغيرها عبارت‌اند از:
: ارزش متغير وابسته براي واحدi ام در دوره tام.
: ارزش متغير توضيحي jام براي واحد iام در دوره tام.

در اين رگرسيون دستگاه عمومي پارامترهاي تمام واحدها در تمام زمان‌ها بيان گرديده است. اختلاف بين مقاطع (بنگاه‌ها، كشورها، مسيرها، استان‌ها و …) در نشان داده مي‌شود و در طول زمان ثابت فرض مي‌گردد. اگر فرض ما اين باشد كه براي تمام بنگاه‌ها ثابت است، روش OLS تخمين‌هاي كارا و سازگاري از به دست خواهد داد. ولي اگر فرض كنيم كه در بين مقاطع مختلف اختلاف وجود دارد، از روشPanel Data براي تخمين استفاده مي‌شود.
براي تعيين وجود (يا عدم وجود) عرض از مبدأ جداگانه براي هر يك از کشورها از آماره به‌صورت زير استفاده می‌شود. فرضيه صفر بيان می‌کند كه براي تمام بنگاه‌ها ثابت است و مي‌توان روش OLS را بکار برد:

(3-15)
در رابطه فوق، URمشخص‌کننده مدل غير مقيد و علامت R، نشان‌دهنده مدل مقيد با يك عبارت ثابت براي کليه گروه‌ها می‌باشد. ، تعداد متغيرهاي توضيحي ملحوظ در مدل، تعداد کشورها و تعداد کل مشاهدات و ( دوره زماني موردنظر) می‌باشد. اگر محاسبه شده از جدول با درجه آزادي و بزرگ‌تر باشد آنگاه فرضيه صفر رد می‌شود و لذا رگرسيون مقيد داراي اعتبار نمی‌باشد و بايد عرض از مبدأهای مختلفي را در برآورد لحاظ نمود (همان منبع).
3-6-5- آزمون هاسمن: انتخاب بين اثرات ثابت يا تصادفي
اگر بعد از انجام دادن آزمون F فرضيه H0 در مقابل H1 رد شده باشد، اکنون اين پرسش مطرح است که مشخص نمايي درست کدام است؟ و مدل در قالب کدام‌ یک از مدل‌هاي اثرات ثابت96 و اثرات تصادفي97 قابل بيان و بررسي مي‌باشد. براي آزمون این‌که مدل با بهره‌گیری از روش اثرات ثابت يا اثرات تصادفي برآورد گردد، از آزمون هاسمن98 به‌صورت زير استفاده می‌شود:
(3-16)
که در آن:
: تفاضل ضرايب برآورد شده براي متغيرهاي توضيحي لحاظ شده در روش اثرات ثابت و تصادفي
()
: واريانس مجانبي
: تعداد مشاهدات
فرضيه صفر اين است که تخمین زن‌های مدل اثرات تصادفي و اثرات ثابت به‌طور اساسي تفاوتي با يکديگر ندارند. اگر فرضيه صفر رد شود نتيجه می‌گیریم که روش اثرات تصادفي مناسب نيست و بهتراست از روش اثرات ثابت استفاده کنيم، آماره هاسمن داراي توزيع کاي _ دو با درجه آزادي برابر تعداد ضرايب تخمين زده‌شده در مدل می‌باشد. اگر آماره محاسبه شده در سطح احتمال معين از توزيع کاي- دو جدول بزرگ‌تر باشد در اين صورت فرضيه صفر رد مي‌شود (همان منبع).
3-6-6- نرمال بودن
برای بررسی نرمال بودن داده‌ها از آزمون‌های نرمال بودن99 استفاده می‌شود. این آزمون‌ها به‌طورکلی به دو گروه روش ترسیمی100 و روش‌های عددی101 تقسیم می‌شوند. روش‌های ترسیمی تنها تصویری از توزیع متغیر تصادفی را ارائه می‌کنند اما روش‌های عددی قادرند معیارهای عینی و کمی برای قضاوت در خصوص نرمال بودن توزیع متغیر تصادفی فراهم نماید. درروش مای عددی می‌توان هم آمار توصیفی و هم از فن‌ها و آزمون‌های مختلف آمار استنباطی استفاده کرد. در این تحقیق با استفاده از آزمون جارک – برا به‌عنوان یک روش عددی به آزمون نرمال بودن داده‌ها پرداخته‌شده است.
در آزمون جارگ – برا از اختلاف بین ضریب کشیدگی و چولگی داده‌های مورد بررسی می‌توان به نرمال بودن توزیع داده‌ها پی برد. در این آزمون فرض صفر مبتنی بر نرمال بودن است که در صورت به دست آمدن احتمال تائید کمتر از 5 درصد، فرض صفر با احتمال 95 درصد اطمینان پذیرفته نمی‌شود (جعفری سرشت، 1389).
3-6-7- ناهمسانی واریانس
یکی از مهم‌ترین فروض مدل کلاسیک رگرسیون خطی این است که اجزای اخلال〖 u〗_itکه در تابع رگرسیون، جامعه ظاهر می‌شوند، دارای واریانس همسان می‌باشند یعنی :=σ^2 E(u_i^2) i=1,2,….n
اگر این فرض تأمین نشود دارای ناهمسانی واریانس خواهیم بود. مشکل ناهمسانی واریانس، در داده‌های مقطعی متداول‌تر از داده‌های زمانی است. ازآنجایی‌که یکی از ابعاد داده‌های تابلویی، بعد مقطعی می‌باشد. لذا در تحقیق حاضر امکان مواجه با مسئله ناهمسانی واریانس وجود دارد. برای رفع ناهمسانی واریانس می‌توان از روش حداقل مربعات تعمیم‌یافته (GLS) استفاده کرد (ابریشمی،1389).
حال سؤال

پایان نامه
Previous Entries منابع پایان نامه ارشد درمورد بورس اوراق بهادار تهران، بورس اوراق بهادار، جامعه آماری، پانل دیتا Next Entries منابع پایان نامه ارشد درمورد هزینه سرمایه، صاحبان سهام، حقوق صاحبان سهام، حاکمیت شرکتی