دانلود پایان نامه ارشد با موضوع شبکه عصبی، بیمه عمر، شبیه‌سازی

دانلود پایان نامه ارشد

مي‌باشد كه همواره برقرار نمي‌باشد كه ما را به سوي استفاده از روش جديدي براي برآورد منحني رگرسيون كه رگرسيون ناپارامتري نام دارد سوق مي‌دهد، لذا در اين بخش به رگرسيون پارامتري از جمله رگرسيون خطي ساده، رگرسيون خطي چندگانه و نحوه برآورد و آزمون ضرايب رگرسيون خواهيم پرداخت.
2-9-1 رگرسيون پارامتري
منظور از بحث و تحليل رگرسيوني عموماً برازش يك الگوي رياضي به داده‌ها مي‌باشد كه نوع رابطه متغيرها را بيان مي‌كند. همچنين از موارد تحليل رگرسيون مي‌توان به بررسي نمودار باقي مانده‌ها، انحراف از الگو، برآورد پارامترهاي الگو و انجام آزمون‌هاي فرض در مورد اين پارامترها و يا مباحث پيش‌بيني متغير وابسته اشاره نمود.
فرض كنيم متغير تصادفي و پيوسته y را در n مقدار مشاهده شده x بدست آورده‌ايم به اين صورت كه براي مقادير x و y از يك طرح نمونه‌گيري باشند كه به وسيله الگوي زير به هم مرتبط هستند:
(2-57) و
كه متغيرهاي تصادفي ناهمبسته با ميانگين صفر و واريانس مشترك هستند (كه توزيع را معمولاً توزيع نرمال در نظر مي گيرند). به الگوي (2-57) به دليل آنكه xها غير تصادفي فرض شده‌اند، الگوي طرح ثابت 36مي‌گويند.
2-9-2 رگرسيون خطي ساده
بيش از 100 سال پيش فرانسيس گالتون در مقاله‌اي كه در زمينه رگرسيون مطرح كرد، اظهار داشت كه متوسط قد پسران داراي پدران قد بلند كمتر از قد پدرانشان مي‌باشد. به نحو مشابه متوسط قد پسران داراي پدران كوتاه قد نيز بيشتر از قد پدرانشان گزارش شده است. بدين ترتيب گالتون پديده بازگشت به سمت ميانگين را در داده‌هايش مورد تأكيد قرار داد. براي گالتون رگرسيون مفهومي زيست شناختي داشت اما كارهاي او توسط (كارل پيرسون) براي مفاهيم آماري توسعه داده شده است. گرچه گالتون براي تأكيد بر پديده «بازگشت به سمت مقدار متوسط» از تحليل رگرسيون استفاده كرد اما به هر حال امروزه واژه تحليل رگرسيون جهت اشاره به مطالعات مربوط به روابط بين متغيرها به كار برده مي‌شود. در حقيقت تحليل رگرسيوني فن و تكنيكي آماري براي بررسي و مدل‌سازي ارتباط بين متغيرهاست. شمايي كلي و خلاصه شده از يك تحليل رگرسيوني ساده اين است كه در ابتدا تحليل‌گر حدس مي‌زند كه بين دو متغير نوعي ارتباط وجود دارد، در حقيقت حدس مي‌زند كه يك رابطه به شكل يك خط بين دو متغير وجود دارد و سپس به جمع آوري اطلاعات كمي از دو متغير مي‌پردازد و اين داده‌ها را به صورت نقاطي در يك نمودار دو بُعدي رسم مي‌كند. اين نمودار كه به نمودار پراكندگي معروف است نقش بسيار مهمي در تحليل‌هاي رگرسيوني و نمايش ارتباط بين متغيرها ايفا مي‌كند. در صورتي كه نمودار نشان دهنده اين باشد كه داده‌ها تقريباً در امتداد يك خط مستقيم پراكنده شده‌اند، حدس تحليل‌گر تأييد شده و اين ارتباط خطي به صورت زير نمايش داده مي‌شود.
(2-58)
كه در آن عرض از مبداً و شيب اين خط است. بين برخي از نقاط و تصوير آنها بر روي خط همواره تفاوت به چشم مي‌خورد كه از آن به عنوان خطاي برآورد ياد مي‌كنيم. اين خطا ممكن است از خطا در اندازه‌گيري، شرايط محيطي، تفاوت‌هاي طبيعي و … ناشي شده باشد. بنابراين معادله اوليه را به صورت زير اصلاح مي‌كنيم:
(2-59)
معادله بالا يك مدل رگرسيون خطي ناميده مي‌شود. معمولاً به x متغير مستقل (رگرسيوني) و به y متغير وابسته (پاسخ) و به خطاي تصادفي گفته مي‌شود كه براي كامل شدن مدل (3-59) و نشان دادن اين كه خطا نيز تا حدودي وجود دارد، فرض‌هاي زير را در نظر مي‌گيريم:
به ازاي تمام مقادير و از آن نتيجه مي‌گيريم كه
به ازاي تمام مقادير
به ازاي تمام مقادير
در ادامه فرض نرمال بودن را نيز به اين فرض ها اضافه مي‌كنيم. و تأكيد مي‌كنيم كه هر يك از اين فرض‌ها ممكن است براي داده‌هاي واقعي برقرار نباشند.

2-9-2-1. برآورد ضرايب رگرسيون خطي ساده
تا اين مرحله مدل رگرسيوني معرفي شده و كافي است پارامترهاي مجهول مدل اعم از محاسبه شوند. برآورد پارامترها در مدل‌سازي با استفاده از روش‌هاي مختلف انجام مي‌شود از جمله روش كمترين مربع خطا، كه يكي از روش‌هاي مورد استفاده در تحليل رگرسيون مي‌باشد. مرحله بعدي «كنترل مناسب بودن مدل است» كه مدل از نظر قابل استفاده بودن و قابليت تعميم بررسي مي‌شود. در نتيجه فرآيند تحليل رگرسيوني فرآيندي همراه با كنترل و بازنگري است. به اين ترتيب كه ابتدا مدلي معرفي مي‌شود و كيفيت مدل مورد آزمون قرار مي‌گيرد و در نتيجه آن مدل مورد قبول و يا رد مي‌شود. روش رايج جهت برآورد پارامترها از طريق كمينه كردن تابع زير بدست مي‌آيد:
فرمول (2-60)
در اين مدل و ها طوري تعيين مي‌شوند كه SSE 37كمينه شود.

از طريق مشتق گيري جزيي معادله….. نسبت به و و مساوي صفر قرار دادن آنها، مقادير و به صورت زير محاسبه مي‌شوند.
فرمول (2-61)
و
فرمول (2-62)
كه در آن و ميانگين نمونه‌اي و هستند.
بايد توجه داشته باشيم كه فرض‌هاي عنوان شده در ….. در محاسبه و نا اريب خواهند بود.
2-9-2-2 آزمون ضرايب رگرسيون خطي ساده
آزمون‌هاي فرض در مورد نسبت به بيشتر مورد توجه است. زيرا هدف اوليه تحقيقات اين است كه معين كنيم آيا يك رابطه خطي بين x و y وجود دارد يا خير. در اين بخش فرض مورد آزمون قرار مي‌دهيم. فرض مي‌كنيم ها ناهمبسته هستند و داريم يعني اين فرض به همراه سه فرض اصلي اشاره شده در بخش (2-9-2) يك مدل خطي نرمال به ما مي‌دهد چون ناهمبسته هستند. نرمال بودن آنها نتيجه مي‌دهد كه مستقل نيز هستند و در نتيجه ها هم مستقل هستند و داريم:
( 2-63)
در اين صورت چون به صورت تابع خطي از متغيرهاي تصادفي مستقل و نرمال ، پس داراي توزيعي نرمال مي‌باشد.
با بسط رابطة ( 2-64)
داريم
(2-65)
(2-66)

در نتيجه اميد رياضي به صورت(2-67)
كه با ساده كردن رابطه‌ي بالا داريم

و به طرز مشابه مي‌توان نشان داد كه (2-69)

اگر نامعلوم باشد با فرض درست بودن مدل، مي‌توان برآورد آن يعنيرا استفاده كرد.
با جمع بندي مطالب بالا مي‌توانيم به نتيجه زير برسيم.
(2-70)
از طرفي چون مي‌باشد با استاندارد كردن و تبديل آن به توزيع كاي دو رابطه زير به دست مي‌آيد:
(2-71)
مي‌دانيم كه اگر y و z متغيرهاي تصادفي مستقلي باشند كه به ترتيب داراي توزيع كاي دو با v درجه آزادي و نرمال استاندارد باشند، متغير
( 2-72)

داراي توزيع t با υ درجه آزادي مي‌باشد. در نتيجه با استفاده از اين روابط و روابط (3-68)و (3-71) و (3-72) نتيجه مي شود كه
( 2-73)

داراي توزيع t با (υ) درجه آزادي مي‌باشد. لذا فرض در برابر فرض رد مي‌شود. اگر باشد. اين آزمون را مي‌توان با استفاده از –p مقدار هم انجام داد به اين ترتيب كه اگر آنگاه فرض را رد مي‌كنيم. اگر قدر مطلق كوچك و احتمال رد فرض صفر زياد است.
2-9-3 رگرسيون خطي چندگانه
در بسياري از موارد عملي پاسخ متغير y وابسته به چند متغير مستقل مي‌باشد. مدل رگرسيوني كه بيش از يك متغير مستقل داشته باشد را يك مدل رگرسيوني چندگانه مي‌نامند. در يك مدل خطي، متغير پاسخ y را به چندين متغير مستقل به صورت زير مربوط مي‌سازد.

كه در اينجا تغييرات تصادفي y را كه به وسيله xها بيان نمي‌شود نشان مي دهد. ضرايب رگرسيوني را تا هنگامي كه مدل نسبت به ها خطي است مي‌توان با روش OLS (كمترين مربعات) برآورد كرد. براي اين منظور n مشاهده را روي yها و xها به صورت زير فرموله مي‌كنيم.

فرض‌هاي مربوط به ها و ها مشابه آنهايي هستند كه در رگرسيون ساده در نظر گرفتيم.
2-9-3-1 برآورد ضرايب رگرسيون خطي چندگانه
در اينجا براي برآورد ها از روش كمترين مربعات استفاده مي‌كنيم.
در برآورد پارامترهاي ، برآوردگرهايي را پيدا مي‌كنيم كه مجموع مربعات انحراف‌هاي n مشاهده از را مينيمم سازد. به بياني ديگر مقدار
(2-76)
به ازاي مقادير و … و مينيمم شود. اين كار با مشتق گيري و برابر صفر قرار دادن رابطه‌ي فوق حاصل مي‌شود كه براي k+1 معادله بايد تواماً حل شود.

2-9-3-2 آزمون ضرايب در رگرسيون خطي چندگانه
براي انجام آزمون معناداري ضرايب رگرسيون بايد فرض نرمال بودن خطاها ()ها و استقلال آنها در نظر گرفته شود. براي اين كار فرض مي‌شود ميانگين خطاها صفر و واريانس آنها برابر است. در نتيجهها توزيع نرمال خواهد داشت و از يكديگر مستقل هستند و ميانگين و واريانس آنها برابر به ترتيب و خواهد شد.
براي آزمون معني‌دار بودن ضريب رگرسيون مانند فرض‌هاي آماري به فرم زير را تنظيم مي‌كنيم.
و
تحت فرض نرمال بودن خطاها و مشابه آنچه كه در مبحث رگرسيون با تك متغير مستقل داشتيم، آماره آزمون را به اين شكل تنظيم مي‌كنيم.

حال اگر باشد يا باشد، آنگاه فرض صفر رد مي‌گردد.

فصل سوم
مواد و روش‌ها

3-1 مقدمه
در این فصل به بررسی روش به‌کارگرفته در تحقیق م پردازیم. بدین منظور و برای سهولت در تهیه و تدوین این فصل، رئوس کلی آن را در فالب گام ‌های زیر مشخص می‌کنیم.
مروری بر فرضیات تحقیق
بررسی مبانی نظری تحقیق
گزینش متغیرهای توضیحی تحقیق
محدوده زمانی و مکانی تحقیق
برازش مدل رگرسیونی به داده‌ها
انتخاب پارامترهای ورودی، توپولوژی و الگوریتم آموزشی مناسب برای شبکه عصبی
شبیه‌سازی با شبکه عصبی منتخب
مقایسه نتایج حاصل از هر دو روش رگرسیون خطی و شبکه عصبی مصنوعی
مروری بر فرضیات تحقیق
3-2-1 فرضیه اصلی
با توجه به قابليت‌هاي به اثبات رسيده شبكه‌هاي عصبي در زمينه‌هاي مرتبط، فرض ما اين است كه شبكه‌هاي عصبي مي‌توانند به‌عنوانابزار مناسبي در پیش‌بینی تقاضا برای بیمه عمر در ایران به‌كار گرفته شوند.
3-2-2 فرضیه های فرعی
تولید ناخالص داخلی بر (حق بیمه‌های عمر دریافتی) تاثیر معنی داری دارد.
تورم بر (حق بیمه‌های عمر دریافتی) تاثیر معنی داری دارد.
مصوبه مجلس مبنی بر اجباری شدن بیمه عمر کارکنان دولت بر (حق بیمه‌های عمر دریافتی) تاثیر معنی داری دارد.
گزینش متغیرهای توضیحی تحقیق
در قسمت 3-3 تعدادی از متغیرهای به‌کار گرفته شده را بررسی کردیم. شبکه‌های عصبی مصنوعی نسبت به حجم داده‌های آموزشی حساس می‌باشند و هرچه تعداد داده‌های آموزشی به شبکه بیشتر باشد، نتایج شبیه‌سازی به واقعیت نزدیک‌تر می‌شوند. یکی از محدودیت‌های تحقیق حاضر، نبود اطلاعات کافی مربوط به متغیرهای توضیحی بکار گرفته شده در تحقیقات پیشین بود. به همین علت تعداد متغیرهای ورودی را به سه متغیر کاهش دادیم. که در بخش بعد شرح مختصری از هریک را آورده‌ایم.
چارچوب نظری تحقیق
با توجه با ادبیات موضوع و تحقیقات گذشته و با توجه به محدودیتی که در دسترسی به داده‌های مورد نیاز بود، یک سری متغیر ها گزینش شدند. در این تحقیق حق بیمه‌های عمر دریافتی به عنوان متغیر وابسته می باشد که اطلاعات مربوط به آن از آمار و اطلاعات منتشره از سوی بیمه مرکزی ایران بدست آمده است.
متغیرهای مستقل این تحقیق به قرار زیر می باشد :
تولید ناخالص داخلی
در ميان شاخص‌هاي اقتصاد كلان، توليد ناخالص داخلي از اهميت ويژه‌اي برخوردار است. زيرا نه تنها به‌عنوان مهم‌ترين شاخص عملكرد اقتصادي در تجزيه و تحليل‌ها و ارزيابي‌ها مورد استفاده قرار مي‌گيرد، بلكه بسياري از ديگر اقلام كلان اقتصاد محصولات جنبي محاسبه و برآورد آن محسوب مي‌گردند.كل ارزش ريالي محصولات نهايي توليدشده توسط واحدهاي اقتصادي مقيم كشور در دوره زماني معين ( سالانه يا فصلي ) را توليد ناخالص داخلي مي‌نامند.هريك از محصولات

پایان نامه
Previous Entries دانلود پایان نامه ارشد با موضوع يادگيري، الگوريتم، مي‌شود. Next Entries دانلود پایان نامه ارشد با موضوع بیمه عمر، نرخ بهره، جبران خسارت