پایان نامه با کلید واژگان متغیر مستقل، روش حداقل مربعات، رگرسیون خطی

دانلود پایان نامه ارشد

) داده‬های مقطعی
داده‬هایی هستند که در یک مقطع مشخص از زمان محاسبه و جمع‬آوری می شوند. به عنوان مثال، اگر متغیر SDA برای 100 شرکت و در یک مقطع خاصی از زمان (مثلا سال 1385 ) جمع آوری گردد، این داده‬ها را مقطعی گویند. در این حالت تعداد مشاهدات (N) برابر 100 است (آذر و مومنی، 1389).
ج) داده‬های تابلویی
داده‬هایی هستند که از ترکیب دو دسته داده‬های سری زمانی و مقطعی حاصل می شود. در بسیاری از موارد محققین از این روش برای مواردی که نمی توان مسائل را به صورت سری زمانی یا مقطعی بررسی کرد و یا زمانی که تعداد داده‬ها کم است استفاده می کنند. ادغام داده‬های سری زمانی و مقطعی و ضرورت استفاده از آن بیشتر به خاطر افزایش تعداد مشاهدات و بالا بردن درجه آزادی است. زیرا در بررسی امکان دارد تعداد مقاطع زیاد و دوره‬های زمانی کم باشد و یا برعکس تعداد دوره‬های زمانی نسبتا زیاد و تعداد مقاطع کم باشد. در این صورت تعداد مشاهدات (n ) برابر است با تعداد سال‬های مورد نظر (t ) ضرب در تعداد داده‬های مقطعی در یک سال (n ) (آذر و مومنی، 1389). در این تحقیق از تکنیک داده‬های تابلویی استفاده شده است.
3-11 مزایای استفاده از داده های تابلویی
استفاده از داده‬های تابلویی دارای مزایای فراوانی است. در ذیل پاره‬ای از این مزایا معرفی می گردد:
از آن جایی که داده‬های تابلویی به افراد، بنگاه ها، کشورها و … طی زمان ارتباط دارند، وجود ناهمسانی واریانس در این واحدها محدود می‌شود. تکنیک های تخمین با داده‬های تابلویی می توانند این ناهمسانی واریانس را با متغیرهای تکی خاص مورد بررسی و ملاحظه قرار دهند.
با ترکیب مشاهدات سری زمانی و مقطعی، داده‬های تابلویی با اطلاعات بیشتر، تغییرپذیری بیشتر، هم خطی کمتر میان متغیرها، درجات آزادی بیشتر و کارایی بیشتر را ارائه می نمایند.
داده‬های تابلویی، چارچوب مناسب برای تحلیل کلی داده‬ها فراهم نموده و در حذف یا کاهش خطای برآورد نقش مهمی را ایفا می نمایند.
داده‬های تابلویی، تأثیراتی را که نمی‬توان به سادگی در داده‬های مقطعی و سری زمانی مشاهده کرد، بهتر معین می کنند.
داده‬های تابلویی ما را قادر می سازد تا مدل‬های رفتاری پیچیده‬تر را مطالعه کنیم.
بطور کلی باید گفت داده‬های تابلویی تحلیل‬های تجربی را به شکلی غنی می‬سازند که در صورت استفاده از داده‬های سری زمانی و مقطعی این امکان وجود ندارد (گجراتی59، 1390).
3-12 تخمین مدل رگرسیون با داده‬های تابلویی
چارچوب اصلی برای داده‬های تابلویی به صورت زیر است:

که در آن:
= β عرض از مبداء
= X_it شامل k متغیر توضیحی است یعنی β = (β1, β2,…, βk)
= U_itجمله اخلال مدل می باشد که از فروض کلاسیک رگرسیون خطی پیروی می کند.
= i تعداد مقاطع i= 1,2,…, N
= t دوره زمانی t= 1,2,…, T
در این صورت تخمین معادله فوق به فروض ما درباره عرض از مبدأ ضرایب شیب و جمله خطایU بستگی دارد. روش‬های چندی در رابطه با این فروض وجود دارد که به پنج حالت زیر تقسیم می شود:
عرض از مبدأ و ضرایب شیب در طول زمان و در مقاطع ثابت بوده و جمله خطا در طول زمان و برای مقاطع مختلف متفاوت است.
ضرایب شیب ثابت بوده، اما عرض از مبدأ برای مقاطع مختلف، متفاوت است.
ضرایب شیب ثابت بوده، اما عرض از مبدأ برای مقاطع و در طی زمان متفاوت است.
تمامی ضرایب و عرض از مبدأ و ضرایب شیب، برای مقاطع مختلف، متفاوت است.
تمامی ضرایب و عرض از مبدأ، هم نسبت به زمان و هم نسبت به واحدهای مقطعی متفاوت است (گجراتی، 1390).
3-12-1 نحوه عملکرد جمله AR
وجود خود همبستگی، نشان دهنده این مطلب است که بین اجزای اخلال یک دوره با دوره‬های گذشته ارتباط وجود دارد. ورود جملات َAR در هر مرتبه، موجب برطرف شدن خود همبستگی مرتبه اول، دوم و n ام می شود. به این صورت که فرض می شود که رابطه اجزای اخلال به صورت زیر باشد:
ut = ρ.ut-1 + εt
که در آن ρ معروف به ضریب خود همبستگی و εt جزء اخلال تصادفی می باشد. چنان چه ρ=1 باشد، خواهیم داشت:
ut – ut-1 = εt
به این ترتیب معادله رگرسیون برای دوره های t و 1 –t به صورت زیر خواهد بود:
Yt= β0 + β1xt + ut

Yt-1= β0 + β1xt-1 + ut-1
با کسر دو معادله از هم، به معادله زیر می رسیم که در واقع جزء اخلال این معادله عددی است که از تفاضل دو جمله خطای قبلی بدست آمده و مستقل از جملات دیگر است:
∆Yt= β1∆xt + εt
بدین ترتیب اطلاعات یک دوره از کل دوره‬های مورد بررسی حذف شده و خود همبستگی ایجاد شده رفع می شود. لذا جملات AR، در هر مرتبه‬ای منجر به از بین رفتن خود همبستگی بین اجزای اخلال مدل می‬شوند(خاکی، 1390). در این تحقیق به منظور تشخیص خود همبستگی بین اجزای اخلال مدل رگرسیون، از آماره DW (دوربین – واتسن) استفاده شده است.
مشکلات دیگری مانند همبستگی متقاطع در واحدهای تکی در نقاط زمانی یکسان نیز وجود دارند. تکنیک‬های تخمین متعددی برای بررسی برخی از این مشکلات وجود دارد. دو روش بسیار معروف و رایج
عبارتند از:
1. مدل تأثیرات ثابت (FEM )
اصطلاح تأثیرات ثابت ناشی از این حقیقت است که با وجود تفاوت عرض از مبدأ میان شرکت، اما عرض از مبدأ هر شرکت طی زمان تغییر نمی‬کند، یعنی طی زمان بی تغییر است. حالت کلی این رگرسیون به صورت زیر است:
Yit = β0i + β1x1it + β2x2it + … + βmxmit+ uit
i= 1, 2, 3, …, N
t= 1, 2, 3, …, T

2. مدل تأثیرات تصادفی (REM ) یا مدل اجزای خطا (ECM )
در روش اثرهای تصادفی فرض می‬شود عرض از مبدأ یک واحد تکی انتخابی تصادفی از جامعه‬ای بزرگتر با یک میانگین ثابت بیان می‬شود. حالت کلی این مدل به صورت زیر است:
Yit = β0i + β1x1it + β2x2it + … + + βmxmit+ uit
i= 1, 2, 3, …, N
t= 1, 2, 3, …, T
در مشاهدات مختلف، فرض می کنیم در هر مشاهده عرض از مبدأ به صورت زیر تغییر می کند: 0β برای در نظر گرفتن تفاوت این مدل به روش حداقل مربعات تعمیم یافته برآورد می شود (گجراتی، 1390).
β0i= β0 + εi
i= 1, 2, 3,…, N
3-12-2 انتخاب مدل مناسب در داده‬های تلفیقی
چالش پیشروی محقق عبارت است از این که کدام مدل بهتر است؟ موندلاک (1961 ) و والاک وهاسین(1969) از مدل اثرات ثابت حمایت کرده و بالسترا و نرلاو (1966) به طرفداری از مدل اثرات تصادفی پرداختند( بالتاجی، 2005). به منظور تعیین نوع مدل، از بین مدل های معتبر با توجه به تفاوت درجه آزادی، بر اساس معیار R، بهترین مدل با استفاده از آزمون هاسمن انتخاب شده است.
برای آزمون فرضیه‌ها از روش رگرسیون چند متغیره استفاده شده است. رگرسیون در اصطلاح کاربردی به معنی پی‌بردن به رفتار یک متغیر به کمک رفتار متغیر دیگر است. در آمار رگرسیون یک نوع رابطه یا تابع ریاضی که بین متغیر وابسته از یک طرف و متغیر مستقل از سوی دیگر برقرار می‌باشد.
در رگرسیون خطی دو‌متغیری، یک خط مستقیم از نقاط پراکندگی عبور می‌کند که معادله این خط، معادله رگرسیون نامیده می‌شود و میزان تغییر را ضریب رگرسیون می‌نامند که عبارتست از میزان تغییر در متغیر وابسته به ازای یک واحد تغییر در متغیر مستقل. خط رگرسیون منعکس‌کننده مسیر حرکت پراکنده در دستگاه مختصات است که می‌تواند مبین شدت و ضعف و نوع همبستگی بین متغیرها باشد.
در این معادله y برابر مقدار پیش‌بینی شده متغیر وابسته، a برابر با مقدار ثابت یا عرض از مبدا نقطه تقاطع خط رگرسیون با محور متغیر وابسته، β برابر با ضریب رگرسیون یا شیب منحنی متغیر مستقل است. ضریب همبستگی رابطه بین y و ترکیب خطی x رابیان می‌کند. برای آزمون فرضیه، اثر متغیر مستقل بر متغیر وابسته آزمون می‌شود (هومن، 1385،ص 85).

در آزمون معنی‌دار بودن کل رگرسیون و رابطه خطی:
فرضیه صفر بیانگر ضرایب کل رگرسیون برابر با صفر است.
فرضیه تحقیق بیانگر حداقل یکی از ضرایب متغیر مستقل معنی‌دار است.
در صورتی که آماره محاسبه شده آزمون بزرگتر از آماره بحرانی باشد و یا سطح معنی‌داری محاسبه شده کوچکتر از 05/0 باشد، نشان دهنده‌ی این است که حداقل یکی از متغیرهای مستقل دارای ضریب رگرسیون معنی‌دار است و یا رابطه خطی بین دو متغیر وجود دارد.
برای آزمون ضریب جزئی رگرسیون از آزمون t استفاده می‌شود. در این آزمون:
فرضیه صفر بیانگر معنی‌دار نبودن ضریب جزئی رگرسیون است.
فرضیه تحقیق بیانگر معنی‌دار بودن ضریب جزئی رگرسیون است.
در صورتی که آماره محاسبه شده آزمون برای متغیر مستقل، بزرگتر از آماره بحرانی باشد و یا سطح معنی‌داری محاسبه شده کوچکتر از 05/0 باشد، نشان دهنده معنی‌دار بودن ضریب متغیر مستقل است.
مقدار قدر مطلق ضریب همبستگی(r)، شدت رابطه خطی بین دو متغیر را اندازه می‌گیرد. مقدار r در بازه تغییر می کند. هر چه مقدار قدر مطلق r به 1 نزدیکتر باشد، بیانگر رابطه قوی‌تر است و اگر هیچ رابطه‌ای بین دو متغیر وجود نداشته باشد، مقدار r برابر با صفر خواهد بود. علامت r نشان‌دهنده جهت رابطه است.
به منظور درک بهتر از مفهوم همبستگی و قابلیت تفسیر نتایج آن، معمولاً ضریب همبستگی را به توان 2 رسانیده و ضریب تعیین را بدست می‌آورند که با r^2 نشان داده می‌شود و مقدار آن همیشه بین صفر و یک است. ضریب تعیین، نشان می‌دهد که چند درصد از تغییرات y ناشی از تغییرات x می‌باشد و چند درصد از این تغییرات به x مربوط نمی‌شود. ضریب تشخیص به این صورت تحلیل می‌شود که:
متغیر مستقل هیچ تغییری در متغیر وابسته ایجاد نمی‌کند. ( r^2=0)
تمام تغییرات متغیر وابسته توسط متغیر مستقل بیان می‌شود. ( r^2=1)
هر چه قدر مطلق ضریب تعیین از صفر بزرگتر و به 1 نزدیکتر باشد، نشانگر قوی بودن رابطه بین متغیر مستقل و وابسته است.
روش حداقل مربعات تعمیم یافته(GLS)60
یکی از مهمترین مفروضات مدل کلاسیک رگرسیون خطی(CLR)61 این است که واریانس هر جز جمله خطا u_i، به شرط مقدار معینی از متغیرهای توضیحی، مقدار ثابتی مساوی با σ^2 می باشد. فرضی که در اصطلاح، همسانی واریانس62 نامیده می شود:

با قبول فرض فوق، تخمین زننده u_i از طریق OLS معمولی بهترین تخمین زن خطی بدون تورش(BLUE) محسوب خواهد شد. اما چنانچه فرض ناهمسانی واریانس63، جایگزین فرض همسانی گردد، دیگر تخمین زن مزبور بهترین( دارای حداقل واریانس با کارایی) نخواهد بود. علت آن است که OLS معمولیوزن و یا اهمیت یکسانی به هریک از مشاهدات می دهد. در چنین شرایطی( به شرط مشخص بودن واریانس های نا همسان) لازم است متغیرهای تابع اصلی بر عامل u_i تقسیم گردد تا متغیرهای تبدیل شده( ستاره دار) بدست آید.
روش تبدیل متغیرهای اصلی به نحوی که متغیرهای تبدیل شده، فروض مدل کلاسیک را تامین نموده و سپس به کار بردن روش OLS در مورد آن ها به روش حداقل مربعات تعمیم یافته(GLS) معروف می باشد. در صورتی که Ω مشخص باشد، GLS بر مبنای ساختار واقعی واریانس BLUE بوده و کلیه تخمین زننده های GLS به طور مجانبی کارا خواهند بود. ماتریس Ω به صورت زیر خواهد بود:

در GLS با استفاده از ماتریس Ω، لازم است θ محاسبه شود:

بدین ترتیب متغیرهای تبدیل شده بشرح زیر خواهند بود:

در نهایت با بکاربردن روش OLS بر مبنای متغیرهای تبدیل شده خواهیم داشت:

از آنجاییکه Ω اغلب مشخص نمی باشد، لذا اغلب به جای روش GLS ، از روش حداقل مربعات تعمیم یافته عملی(FGLS)64 استفاده می شود.
3-13خلاصه فصل
در این فصل روش تحقیق مورد استفاده به تفصیل بیان شد. در این رابطه، انواع متغیرهای مورد استفاده در مدل اصلی تحقیق، آزمون‌های مورد نیاز در خصوص داده‌ها و مبانی آماری و اقتصادسنجی مورد نظر برای آزمون فرضیات تشریح گردید. هم چنین، مبناهای محاسباتی و نحوه به‌کارگیری سنجه‌های موردنیاز که به عنوان متغیر وابسته در نظر گرفت

پایان نامه
Previous Entries پایان نامه با کلید واژگان حقوق صاحبان سهام، صاحبان سهام، اندازه شرکت Next Entries پایان نامه با کلید واژگان تحلیل اطلاعات، مدل رگرسیون، ریسک سیستماتیک