تحقیق با موضوع متغیر مستقل، رگرسیون لجستیک، آزمون های آماری

دانلود پایان نامه ارشد

بختها برابر است با ۸/(۴٫۵)=۱٫۷۸ یعنی در زنان نسبت شرکت در انتخابات نزدیک به دو برابر مردان است.

نکات:
نسبت بختها در فرمول با نماد OR ودر خروجی SPSS با نماد EXP(B)مشخص شده است.
در تفسیر نتایج نسبت بختها باید قواعد زیر را رعایت کنیم
*-هرگاه نسبت بختها بزرگتر از عدد یک باشد تغییر(اثر) متغیرهای مستقل و وابسته مثبت و هم جهت است. یعنی با افزایش مقدار متغیر مستقل مقدار متغیر وابسته نیز افزایش مییابد.
*- هرگاه نسبت بختها کوچکتراز عدد یک باشد تغییر متغیرهای مستقل و وابسته منفی و در جهت خلاف هم است.
*- هرگاه نسبت بختها برابر با عدد یک باشد متغیر مستقل تاثیر معناداری بر متغیر وابسته ندارد و مقدار بتا با اثرآن صفر است.
۳. نسبت بختها را میتوانیم به دو شیوه تفسیر کنیم؛
*. در شیوه اول همانطور که در بالا اشاره شد براساس نسبت تغییر در متغیر وابسته به ازای یک واحد تغییر در متغیر مستقل تعریف میکنیم.به عنوان مثال نسبت بختهای۱٫۷۸ در مثال مربوط به شرکت مردان و زنان در انتخابات نشان میدهد که زنان دو برابر مردان در انتخابات شرکت کردهاند.
*. در شیوه دوم میتوانیم نسبت بختها را به صورت درصد تفسیر کنیم. برای این کار ابتدا نسبت بختها را از عدد یک کم میکنیم و سپس در عدد صد ضرب میکنیم به عنوان مثال اگر نسبت بختهای ۱٫۷۸ از عدد یک کم کنیم و در صد ضرب کنیم حاصل آن ۷۸ درصد خواهد بود که نشان میدهد با افزایش یک واحد در متغیر جنسیت بخت شرکت در انتخابات به اندازه ۷۸ درصد افزایش مییابد.

مقادیر لجیتی:
اینکه مطمئن شویم، مقادیر پیش بینی شده خارج از محدوده ۰ و ۱ قرار نمیگیرند. میبایست تبدیلاتی انجام گیرد.
تبدیلات لجستیک این فرایند را دو مرحله انجام میدهند:
*.نشان دادن احتمالات با عنوان odds: که در مطالب قبل توضیح داده شد.
*. به دست آوردن مقادیر لجیتی:
برای بدست آوردن یک متغیر متریک با مقادیر مثبت و منفی ما نیاز داریم که مقدار جدیدی را بدست آوریم به این دلیل که odds مقادیر منفی اختیار نمیکند بنابراین مقادیر لجیتی را معرفی می کنیم که از لگاریتم گرفتن از odds بدست میآید
Logit_i=ln(〖prob〗_event/(1-〖prob〗_event ))=b_0+b_1 X_(1+)…+b_n X_n

〖odds〗_i=(〖prob〗_event/(1-〖prob〗_event ))=e^(b_(0+) b_1 x_(1+…+) b_n x_n )
ضرایب و تفسیر
یکی از مزیت های رگرسیون لجستیک این است که برای تعریف یک ارزش دوتایی برای متغیر وابسته فقط نیاز داریم که یک رویداد اتفاق می افتد یا خیر .وقتی که ما این اطلاعات را آنالیز می کنیم از تبدیلات لجیتی استفاده میشود،در حالی که رگرسیون لجستیک و ضرایبش معنایی متفاوت با رگرسیون چندگانه دارد.اینکه ضرایب لجستیک را در فرم اصلی آن تفسیر کنیم کار مشکلی است به این دلیل که این ضرایب به صورت اصطلاحات لگاریتمی بیان شدهاند.بنابراین اکثر برنامههای کامپیوتری یک ضرایب لجستیکی نمایی205 در نظر گرفتهاند.که به صورت آنتی لگاریتم از ضرایب اصلی تعریف میشود.

جهت تاثیر:
یک جهت رابطه/تاثیر (منفی یا مثبت ) این موضوع را میرساند که تغییر در مقدار یک متغیر وابسته به تغییر در مقدار متغیر وابسته میباشد.جهت مثبت نشان دهنده این میباشد که افزایش در متغیر مستقل باعث افزایش در متغیر وابسته میباشد و برعکس برای جهت منفی.در ادامه این موضوع نشان داده شده که تفسیر جهت برای ضرایب اصلی و نمایی شده تفاوت دارد.
تفسیر جهت ضرایب اصلی :
علامت ضرایب (مثبت یا منفی ) اصلی نشان دهنده جهت رابطه(تاثیر) میباشد.یک ضریب مثبت احتمالات را افزایش میدهد در صورتی که یک ضریب منفی احتمالات پیش بینی شده را کاهش میدهد.
تفسیر جهت ضرایب نمایی شده:
چون ضرایب نمایی شده به صورت آنتی لگاریتم ضرایب اصلی معرفی میشوند و به صورت odds میباشند .بنابراین هیچ وقت مقادیرمنفی را دراختیار نمیگیرند وبه صورت متفاوتی نسبت به ضرایب اصلی تفسیر میشوند.بنابراین ضرایب نمایی شده بیشتر از 1 نشان دهنده ارتباط با جهت مثبت میباشد و ضرایب کمتر از 1 نشان دهنده ارتباط با جهت منفی میباشد.
بنابراین با توجه به مطالب ذکر شده میتوان این نتیجه گیری کلی را گرفت که؛
ضرایب اصلی لجستیک:
برای تعیین بزرگی رابطه خیلی مفید نیستند زیرا بیشتر تغییر در ارزش لجیتی را نشان میدهند .
و در مقابل
ضرایب نمایی شده لجستیک:
این ضرایب به طور مستقیم تغییر در مقدار oddsرا نشان میدهند206.اثر این ضرایب به صورت ضرب در هر واحد تغییر متغیر مستقل میباشد.
Perecentage change in odds=(Exponentiated coffi 〖ient〗_i-1.0)×100

تعیین نیکویی برازش مدل پیش بینی شده:
آزمون نسبت درست نمایی207
در تحلیل رگرسیون لجستیک برای ارزیابی میزان برازش کل مدل از آزمون نسبت درست نمایی LR استفاده می شود که آماره آن x^2 (در نتایج آزمون ام نی بوس208) می باشد.بنابراین در اینجا آماره x^2 معادل آماره F در تحلیل رگرسیون خطی است.هدف آزمون نسبت درست نمایی این است که تفاوت بین احتمال پیش بینی شده حضور یک پاسخ گو در یک طبقه واقعی او را به حداقل کاهش دهد.برای این منظور این آزمون ضرایب لجستیک تولید میکند که قادرند پاسخ گویان را با دقت هر چه بیشتری در طبقه واقعی خود قرار دهند.
نسبت درست نمایی بر اساس تفاوت در مقدار انحراف ها محاسبه می شود.یعنی انحراف بدون وجود متغیر پیش بین در مدل منهای انحراف با وجود متغیر پیش بین در مدل.به عبارتی روشن تر در آزمون نسبت درست نمایی مقدار آماره x^2 یک بار فقط برای عدد ثابت در معادله بدون هیچ متغیر پیش بین و بار دیگر پس از وجود هر متغیر پیش بین به معادله محاسبه میشود.
مقدار انحراف از طریق فرمول زیر محاسبه میشود.
بنابراین مقدار تفاضل دو انحراف از یکدیگر D که نسبت درست نمایی بر اساس آن محاسبه میشود برابر است با.
(مدل با متغیر)- (مدل بدون متغیر) G=x^2 = D
نکته 1: در تفسیر مقدار مثبت درست نمایی با استفاده از معنی داری مقدار آماره x^2 در سطح خطای کوچکتر از 0.05 میتوانیم پی ببریم که آیا مدل رگرسیونی به خوبی دادهها را برازش میدهد یا خیر.
البته باید توجه داشت که برخلاف آمارهx^2پیرسون در جدول توافقی و همچنین سایر آزمون های مشابه که از آماره x^2 استفاده میکنند و در آنها مقدار بالاتر x^2 نشان دهنده میزان بیشتر رابطه یا تفاوت است.در آزمون نسبت درست نمایی برعکس است یعنی در اینجا هر چه مقدار آماره x^2کوچکتر باشد برازش مدل بهتر است.

آماره والد209:
در رگرسیون لجستیک آماره والد معنا دار بودن حضور هر متغیر مستقل در معادله را نشان میدهد.در نتیجه آماره والدمعادل آماره t در رگرسیون خطی است. آزمون والد از رابطه زیر محاسبه میشود که در آن iβ به معنای بتا و ضریب متغیر iX و E. S خطای استاندارد است.
Wald (xi) =(β_i/(S.E))^2
در واقع آماره والد این فرض را به آزمون میگذارد که مقدار تمامیβ ها برابر است با صفر.یعنی میزان تاثیر تمامی متغیرهای مستقل بر متغیر وابسته برابربا صفر است.پس اگر قرار است فرض صفر را رد کنیم حداقل یکی ازβ ها نباید صفر باشد. حال اینکه از مقدارsig بدست آمده برای بررسی این موضوع استفاده می کنیم که درآن چنانچه مقدارsig کمتر از 0.05 باشد فرض اینکه حداقل یکی ازβ ها برابر صفر نیست(فرضH1) پذیرفته میشود.
نکته1: زمانی که مقدار β بزرگ باشد مقدار والد اریب پیدا میکند.
نکته ۲: موقعی که درجه آزادی یک متغیر برابر با یک باشد مقدار آماره والد از جذر نسبت ضریب رگرسیونی β آن متغیر به خطای استاندارد S.E آن به دست میآید اما برای متغیرهای ترتیبی که درجه آزادی آنها همیشه از عدد ۱ بیشتر است درجه آزادی آماره والد یک متغیر برابر است با تعدادطبقات آن متغیر منهای یک N-1
*.در رگرسیون لجستیگ در رابطه با آزمون والد یک بار بر مبنای انیکه فقط عدد ثابت در مدل وجود دارد(STEP 0) و یک بار بر مبنای انیکه تمامی متغیرها در مدل وجود دارند210(STEP 1) نشان داده میشود.
نکته ۲: بر اساس توضیحات بالا مطالب ارائه شده پیشین در رابطه با ضرایب لجستیک نمایی میتوان چنین نوشت که:
۱- برای پی بردن به ارزش کل مدل رگرسیون لجستیک ازآماره〖 x〗^2استفاده میکنیم.
۲- برای پی بردن به معنا داری اثر هر متغیر بر متغیر وابسته از آماره والد استفاده میکنیم.
برای پی بردن به میزان تاثیر هر متغیر بر متغیر وابسته از آمارهEXP(B) استفاده میکنیم.که همان نسبت بخت هاست.بنابراین آماره Wald مقدم بر آماره EXP(B) است.

صحت پیش بینی کنندگی211
این برارزش مدل شامل مراحل زیر میشود؛
ماتریس طبقه بندی
آزمون هاسمر و لِمی شو
ماتریس طبقهبندی212:این ماتریس در واقع بررسی میکند که عضویت در گروه ها درست صورت گرفته است یا خیر و به همین صورت احتمالات را اندازهگیری می کند.
همچنین نتایج بدست آمده از این ماتریس میزان ارزیابی از خطای نوع اول و خطای نوع دوم مدل را نیز نشان میدهد به این نحو که به عنوان مثال در این جدول زیر (۸۳٫۳%-۱) نشان دهنده میزان خطای نوع اول و (۸۴٫۶%-۱) میزان خطای نوع دوم را نشان میدهدو در کل صحت کلی طبقه بندی که توسط این مدل پیشنهاد میشود معادل ۸۴% است.

آزمون هاسمر و لِمی شو213
در این آزمون میزان برازش کلی مدل214 مبنی برمقدارکای دو را نشان میدهد البته به این مفهوم که این آزمون میزان پیش بینی تغییرات متغیر وابسته را با توجه به تمامی متغیرهای سمت راست(اعم ازمستقل، مصنوعی215، کنترل و..) نشان میدهد و به نوعی براي بررسي تطابق داده ها با مدل یا ( توافق بین نتایج مشاهده و نتایج پیش بینی شده) استفاده مي شود معنادار نبودن اين آزمون به معناي عدم تفاوت داده ها با مدل يعني برازش داده با مدل است به نحوی که چنانچه مقدار sig بیشتر از ۵% باشد مطلوبیت برازش کلی مدل مبنی بر پیش بینی صحیح پذیرفته میشود.
همچنین آماره این تست به این صورت می باشد:
البته در رابطه با تعیین میزان درصد تغییرات متغیر وابسته توسط متغیرهای مستقل رگرسیون لجستیک از اطلاعات درج شده از Negelkerk R Square استفاده میشود که این مقدار معادل R2 در رگسیون خطی216 است البته با این تعدیل که این ضریب همبستگی مختص به داده هایی است که متغیر وابسته مدل بین صفر و یک اختیار میشود.

فصل چهارم:
تجزیه و تحلیل
نتایج تحقیق

۴-۱. مقدّمه
همانطور که در فصل سوم روش تحقیق بیان شد این فصل اختصاص به تجزیه و تحلیل نتایج تحقیق دارد که در آن با بهره گيري از روش هاي مناسب و مشخص آماري به بررسي و تجزيه وتحليل اين داده ها خواهيم پرداخت تا نهايتاً با تأييد يا رد فرضيه هاي مطرح شده بتوانيم پاسخي مناسب براي پرسش هاي اين تحقيق بيابيم. پیرامون این فصل آمار توصیفی از متغیرهای مستقل و وابسته تحقیق بیان شده است و به دنبال آن هریک از فرضیه های تحقیق مطرح و با استفاده از آزمون های آماری مورد تجزیه و تحلیل قرار گرفته شده اند.

۴-۲. آمار توصیفی تحقیق
قبل از تجزیه و تحلیل داده ها باید قدم های مقدماتی مشخصی برداشته شود. یک محقق هنگامی که با توده ای از اطلاعات گردآوری شده برای تحقیق روبرو می شود، ابتدا باید آنها را به طریقی سازمان دهی و خلاصه کند تا نکات پنهان داده ها آشکار شده و در نگاه اول ویژگی های مقدماتی آنها بر ملاء شود وقبل از اینکه مستقیما به سراغ آزمون های آماری برود، بتواند با اطلاع از نحوه توزیع داده ها و سایر خصوصیات آنها که با محاسبه بعضی شاخص های آماری آشکار می شود، مسیر روشنی را برای رسیدن به نتایج دنبال کند. تهیه جدول فراوانی، محاسبه شاخص های آماری و رسم نمودار در اغلب موارد برای توصیف داده ها امری ضروری است. از این رو ما قبل از انجام هرگونه آزمون های آماری، به توصیف داده ها به شرح ذیل خواهیم پرداخت.
جدول ۴-۲-۱

کیفیت اقلام تعهدی اختیاری

نسبت بازدهی ارزش ویژه

نسبت ارزش بازار به ارزش دفتری

نسبت درصد سود

پایان نامه
Previous Entries تحقیق با موضوع رگرسیون لجستیک، متغیر مستقل، رگرسیون خطی Next Entries تحقیق با موضوع قلام تعهدی، اقلام تعهدی، اقلام تعهدی اختیاری