مقاله رایگان درباره رگرسیون، رگرسیون خطی، مدل رگرسیون، ضریب تعیین

دانلود پایان نامه ارشد

ن دارای آماره Z کولموگروف اسمیرنوف 452/0- و سطح معناداری (3125/0) می باشد که بیشتر از 05/0 است لذا فرضیه H0 پذیرفته شده و با اطمینان 95% می توان گفت متغیرسابقه حساب جاري مشتريان نیز از توزیع نرمال برخوردار است.
تبعيت متغيرهاي مستقل و تابعي از توزيع نرمال، احتمالا به جهت كاملا تصادفي انتخاب كردن شركت ها در اين تحقيق و بزرگي حجم نمونه تصادفي باشد.
4-4-2- آزمون استقلال خطاها
پیش فرض دیگر استفاده از رگرسیون خطی مرکب در اعتبار سنجي مشتريان حقوقي بانك ها در قلمرو تحقيق، استقلال باقی مانده ها یا خطای برآورد انجام شده به واسطه مدل رگرسیونی است. در این راستا با عنایت به تحقیقات مشابه یا مرتبط می توان از آماره دوربین واتسون استفاده كرد که همبستگي سريالي بين باقيمانده (خطا)هاي رگرسيون را بر مبناي فرض صفر آماري زير آزمون مي‌نمايد:
H0: بین خطاها خود همبستگي وجود ندارد.
H1: بین خطاها خود همبستگي وجود دارد.
اگر آماره دوربین-واتسون بین 5/1 و 5/2 قرار گیرد، فرضيه H0 آزمون (فقدان همبستگی یا استقلال خطاها) پذیرفته می‌شود و در غیر این‌صورت H1 مبنی بر خود همبستگی خطاهای مدل برآوردی را نمی توان رد کرد . بر مبنای محاسبات انجام شده، آماره دوربین واتسن به همراه ضریب تعیین، ضریب تعیین تعدیل شده وخطای استاندارد به شرح جدول 4-4 است:
جدول4-4 آزمون استقلال خطاها
ضریب تعیین
ضریب تعیین تعدیل شده
خطای استاندارد
آماره دوربین واتسن
068/0
052/0
1921/0
8542/1

با توجه به جدول مزبور مقدار آماره دوربین- واتسون برای مدل رگرسیونی تحقیق حاضر برابر با 8542/1 که در فاصله 5/1 و 5/2 قرار دارد است. بنابراين فرض H0 مبني بر فقدان خود همبستگي بین خطاها پذیرفته شده و می توان بر این مبنا از رگرسیون خطی مرکب استفاده نمود.

4-4-3- بررسی نرمال بودن توزیع خطاها
یکی دیگر از پیش فرض های استفاده از رگرسیون خطی مرکب این است که خطاهای معادله برآوردی رگرسیونی نیز همانند متغیرهای مستقل و تابعی از توزیع نرمال برخوردار باشند.
بدین منظور می توان مشابه آزمون نرمال بودن متغیرها از آزمون کولموگروف – اسمیرونوف استفاده کرده یا از مقایسه هیستوگرام توزیع خطاها با منحنی نرمال بهره جست. همانگونه که در نمودار 4-1 مشخص شده، در مدل رگرسیونی برآورد شده میانگین توزیع خطاها تقریباً صفر، و انحراف معیار آن نزدیک به یک (994/0) است، در نتیجه توزیع خطاهای مدل رگرسیون نرمال میباشد.

نمودار 4-1 ارزيابي نرمال بودن توزيع خطاهاي مدل برآوردي رگرسيوني

4-4-4- استقلال خطی متغیرهای مستقل
یکی دیگر از پیش فرض هایی که پیش از به کارگیری رگرسیون خطی مرکب باید مورد ارزیابی قرار گیرد، استقلال خطی متغیرهای مستقل است. این استقلال هم به جهت نظری و هم با آزمون و معیاری آماری صورت می گیرد. به لحاظ نظری متغیرهای مستقل کاملا از یک دیگر استقلال خطی داشته با استثنای ارزش وثيقه ملكي مشتريان از منابع متفاوت و به طرق مختلفی گردآوری شده و به یکدیگر وابستگی خطی ندارند. ارزش وثيقه ملكي مشتريان بر مبناي ضوابط 5/162درصد مبلغ تسهيلات دريافتي مشتريان بوده و اين دو متغير به يكديگر بستگي خطي دارند. در این قسمت از معیار ضریب همبستگی خطی پیرسون نیز به منظور سنجش استقلال خطی متغیرهای مستقل مدل استفاده می شود. جدول 4-5 خلاصه نتایج این ارزیابی را نشان می دهد. در هر خانه به ترتيب ضرایب همبستگی پیرسون و سطح معنی دار می باشد.
جدول 4-5 نتایج ارزیابی استقلال خطی متغیرهای مستقل بر مبناي همبستگي
متغیر
چك برگشتي
ارزش وثيقه
م. تسهيلات
گردش بستانكار
م. موجودي
س.اعتباري
س. جاري
چك برگشتي
1

ارزش وثيقه
0/0123
0/0196
1

مبلغ تسهيلات
0/0245
0/0745
0/9999
0/05241
1

گردش بستانكار
0/2130
0/3254
0/1265
0/0023
0/3521
0/0042
1

معدل موجودي
0/1896
0/0124
0/0125
0/0021
0/1654
0/045
0/1235
0/0052
1

سابقه اعتباري
0/0251
0/0051
0/1121
0/0521
0/0246
0/0098
0/2134
0/1120
0/0897
0/0542
1

سابقه جاري
0/1121
0/0020
0/1548
0/0521
0/1420
0/0854
0/2134
0/0875
0/0125
0/2131
0/0125
0/0215
1
بر مبنای محاسبات انجام شده در ارزیابی استقلال خطی متغیرهای مستقل طبق جدول 4-5 ملاحظه می شود که:
1) بین کلیه متغیرهاي مستقل ارتباط مستقیمی وجود دارد چرا که ضرایب همبستگی محاسبه شده براي همه متغيرهاي مستقل مثبت می باشد.
2) ارتباط خطی بین متغیرهای مستقل به جز ارتباط بين مبلغ تسهيلات دريافتي از مشتريان و ارزش وثيقه ملكي اخذ شده ضعیف است. از آن جهت که ضرایب محاسبه شده، صرف نظر از علامت آن ها به سمت صفر میل کرده است، بر این مبنا می توان این ارتباط را قابل اغماض دانسته و استقلال خطی متغیرهای مستقل را پذیرفت.
3) بين متغيرهاي مبلغ تسهيلات دريافتي توسط مشتريان و ارزش وثيقه دريافتي از آنان ارتباط و بستگي كامل خطي وجود دارد. به جهت اينكه ضريب همبستگي محاسبه شده مربوط به آن حدودا يك مي باشد. اين امر ناشي از احتساب ارزش وثيقه دريافتي از مشتريان بر مبناي ضريب يا درصدي از تسهيلات پرداختي به آن ها است كه بر مبناي ضوابط بانك ملي 5/162درصد مي باشد.
4-4-5- آزمون هم‌خطی بین متغیرهای مستقل
شکل دیگری از ارزیابی استقلال خطی بین متغیرهای مستقل، انجام آزمون هم خطی به صورت دو دویی بین متغیرهای مستقل بر مبنای سنجش عامل تولرانس می باشد که در این قسمت مورد ارزیابی قرار گرفته است. در این ارزیابی هر چه تولرانس کم باشد اطلاعات مربوط به متغیر کم بوده و مشکلاتی در استفاده از رگرسیون ایجاد می‌شود. عامل تورم واریانس نیز معکوس تولرانس بوده و هر چقدر افزایش یابد باعث می‌شود واریانس ضرایب رگرسیون افزایش یافته و رگرسیون را برای پیش‌بینی نامناسب می‌سازد. حداقل ميزان تولرانس براي متغيرهاي مدل در منابع آماري 1/0تا 2/0درصد و حد اكثر مجاز آن معمولا 5 درصد در نظر گرفته مي شود. این ارزیابی به شرح جدول 4-6 خلاصه شده است:

جدول 4-6 ارزيابي استقلال خطي بين متغيرهاي مستقل بر مبناي تولرانس
متغیر
چك برگشتي
ارزش وثيقه
م. تسهيلات
گردش بستانكار
م. موجودي
س.اعتباري
س. جاري
چك برگشتي
—-

ارزش وثيقه
0/9548
1/2345
—-

مبلغ تسهيلات
0/8754
1/0025
0/0021
9/8541
—-

گردش بستانكار
0/9854
1/5243
0/9998
2/1254
0/8895
1/0215
——-

معدل موجودي
0/9999
2/0124
0/8479
1/9854
0/9989
1/0128
0/9854
1/0012
—–

سابقه اعتباري
0/9899
1/0985
0/9001
1/1254
0/9999
0/9998
0/9524
1/2015
0/9214
2/1325
—-

سابقه جاري
0/9992
1/0321
0/9979
1/0658
0/9921
1/0985
0/9919
1/0325
0/9912
2/0231
0/9399
1/0032
—-

بر مبنای نتایج خلاصه شده در جدول 4-6 می توان به صورت دودویی هم خطی بین 7 متغیر مستقل مبلع چك برگشتي، ارزش وثيقه ملكي دريافتي از مشتريان، مبلغ تسهيلات دريافتي توسط مشتريان، گردش بستانكار حساب جاري مشتريان، معدل موجودي حساب جاري مشتريان، سابقه اعتباري و سابقه حساب جاري مشتريان حقوقي بانك ملي ايران در استان اصفهان را نسبت به یکدیگر سنجید. به جهت اينكه تعداد حالات دو دويي مورد مقايسه 21 حالت بوده و طرح همه جزييات به اطاله كلام مي انجامد، در اينجا نتيجه گيري به صورت كلي خلاصه شده است:
1) ميزان تولرانس در مورد همه روابط به استثناي مبلغ تسهيلات و ارزش وثيقه ملكي دريافتي از مشتريان به سمت يك ميل كرده و در نتيجه از حداقل 1/0 يا 2/0 بيشتر است. بنابراين مي توان استقلال خطي بين اين متعيرهاي مستقل را پذيرفت.
2) عامل تولرانس در مورد همه روابط به استثناي مبلغ تسهيلات و ارزش وثيقه ملكي دريافتي از مشتريان به سمت يك ميل كرده و در نتيجه از حد اكثر مجاز آن يعني 5 خيلي كمتر است. بنابراين مي توان استقلال خطي بين اين متغيرهاي مستقل را پذيرفت.
3) ميزان تولرانس محاسبه شده در مورد ارتباط بين مبلغ تسهيلات و ارزش وثيقه ملكي 0021/0 بوده كه به سمت صفر ميل كرده و به مراتب كمتر از حداقل مجاز 1/0 يا 2/0 مي باشد. لذا نمي توان فرض استقلال خطي اين دو متغير را پذيرفت.
4) عامل تولرانس محاسبه شده در مورد ارتباط بين مبلغ تسهيلات و ارزش وثيقه ملكي 8541/9بوده كه به سمت ده ميل كرده و به مراتب بيش از حداكثر مجاز 5 مي باشد. لذا نمي توان فرض استقلال خطي اين دو متغير را پذيرفت.
بنابراين به جز بين دو متغير مبلغ تسهيلات دريافتي توسط مشتريان و ارزش وثيقه ملكي دريافتي از آنان، در ساير موارد مي توان استقلال خطي بين متغيرها را پذيرفت.
4-4-6- آزمون همگنی یا ثبات واریانس ها
در تحقیقات مرتبط یا مشابه، معمولا از نمودار پراكنش باقيمانده هاي استاندارد شده در مقابل پيش بيني هاي استاندارد شده یا از آزمون همسانی واریانس های وایت به عنوان روش ارزيابي يكي ديگر از پيش فرض هاي استفاده از رگرسيون خطي مركب استفاده شده است. در صورت استفاده از نمودار پراکندگی وجود تقارن حول خط صفر و عدم وجود روند در نمودار مذكور نشان دهنده همگني در واريانس مي باشد.
در این تحقیق از آزمون همسانی وایت با دو معیار فیشر و کااسکوئر استفاده شده است. در این آزمون فرض صفر برابری یا همسانی واریانس ها در مقابل نابرابری آن ها به عنوان فرض مخالف است. نتایج این آزمون در جدول 4-7 خلاصه شده است:

جدول 4-7 آزمون همسانی واریانس ها(وایت)
معیار آزمون
آماره آزمون
سطح معنی دار
نتیجه آزمون
آزمون فیشر
5/2154
0/0000
فرض یا همسانی واریانس ها پذیرفته می شود.
آزمون کای دو
84/2345
0/0000
فرض یا همسانی واریانس ها پذیرفته می شود.

بر مبنای نتایج آزمون به شرح جدول 4-7 سطح آزمون در هر دو آزمون فیشر و کااسکوئر به سمت صفر میل کرده و کمتر از 5 و 1 درصد می باشد. بنابراین هم درسطح 95 و هم در سطح 99 درصد اطمینان می توان فرض صفر مبنی بر همسانی یا برابری واریانس ها را پذیرفت.
4-4-7- ساير پيش فرض ها
توجه به ادبیات تحقیق موجود نشان مي دهد كه در موارد محدوديت تعداد افراد نمونه تصادفي از يك طرف و زيادي تعداد متغيرهاي مستقل از طرف ديگر، امكان استفاده از رگرسيون مقطعي يا جداگانه به ازاي هرسال وجود ندارد. در اين موارد از رگرسيون تركيبي يا داده هاي پنلي استفاده شده و در اين صورت جهت تعيين مدل مناسب از آزمون هاي چاو، هاسمن و ديكي فولر استفاده مي شود. در اين تحقيق به جهت تعداد گسترده مشتريان حقوقي در قلمرو تحقيق و انتخاب نمونه تصادفي 400 تايي نيازي به استفاده از داده هاي پنلي و در نتيجه انجام آزمون هاي ياد شده به عنوان پيش فرض هاي روش نبوده است.

4-5- اعتبار سنجي مشتريان بانكي به روش رگرسيون لجستيك
به طوري كه در فصل سوم يا روش تحقيق عنوان شده، به منظور اعتبار سنجي مشتريان از دو روش رگرسيون لجستيك و شبيه سازي به كمك شبكه عاي عصبي استفاده شده است و در اين قسمت اعتبار سنجي به روش اول و در قسمت بعدي نتايج اعتبارسنجي با روش دوم تشريح گرديده است.
به طوری که در بخش قبلی ملاحظه شد، غالب پیش فرض های استفاده از رگرسیون خطی مرکب در برآورد رابطه بین متغیرهابرقرار است. این پیش فرض ها مشتمل بر نرمال بودن توزیع متغیرهای مستقل و تابعی، نرمال بودن توزیع باقی مانده ها یا خطای در برآورد رگرسیونی، استقلال خطی
متغیرهای مستقل یا فقدان هم خطی بین آن ها، همسانی یا ثبات واریانس هاکه در بخش قبلی آزمون گردیده است.
در این بخش با عنایت به برقراری پیش فرض های استفاده از رگرسیون خطی مرکب، از این روش به منظور برآورد رابطه بين ريسك اعتباري مشتريان به عنوان متغیر وابسته و متغيرهاي هفت گانه مستقل چك برگشتي، مبلغ تسهيلات دريافتي توسط مشتريان، ارزش وثيقه دريافتي از مشتريان حقوقي، متوسط موجودي حساب جاري مشتريان،

پایان نامه
Previous Entries مقاله رایگان درباره شبکه عصبی، رگرسیون، شبیه سازی، ریسک اعتباری Next Entries مقاله رایگان درباره استان اصفهان، رگرسیون، جامعه آماری، رگرسیون خطی