پایان نامه ارشد درباره درخت تصمیم، درخت تصمیم گیری، شبکه های عصبی

دانلود پایان نامه ارشد

ساختار مالي عمليات تجاري بسيار پيچيده و پوياست، به كمك سيستم‌هاي عصبي مصنوعي، مي‌توان مدلي از محيط مالي شركت ساخت كه ويژه آن شركت باشد و در طول زمان متناسب با تغيير ساختار مالي شركت پويايي خود را حفظ كند. سه حوزه اصلي اينكار عبارتند از:
1ـ پيش بيني برآورد آتي : در مواردي كه در حوزه‌هاي “پيش بيني مالي” مدل، روابط مشخص و تعريف شده نداشته باشد. مي‌توان از مدل‌هاي شبكه عصبي استفاده كرد. مي‌توان شبكه عصبي را طوري طراحي و آموزش داد كه رفتار سرمايه گذاران نسبت به تحولات شركت يا تغييرات كلي شرايط مالي تقليد كند. اين مدل‌ها مي‌توانند جايگزين مدل‌هاي آماري مثل رگرسيون خطي و… شوند.
2ـ ارزشيابي : به كمك شبكه‌هاي عصبي مي‌توان ارزش سهام و دارايي‌هايي را كه مي‌خواهيم خريداري كنيم، برآورد كنيم در اين مهم بايد فرآيند ارزشيابي انساني شبيه سازي گردد. سيستم مي‌تواند به طور خودكار نسبت به تغييرات در رويه‌هاي عملي تحليلي و ضوابط انتخاب تصميم- گيرندگان در طول زمان، خود را سازگار كند، اين مدل‌ها مبتني بر پايگاه‌هاي اطلاعاتي عمده هستند.
3ـ تصويب اعتبارات : تعيين سقف اعتباري يك امر زمان بر و كاربر است. مي‌توان با شبكه عصبي سيستم تصويب اعتبارات را به نحوي طراحي و آموزش داد كه اطلاعات ورودي آن داده‌هاي مربوط به مشتريان و داده‌هاي خروجي مطلوب آن، تصميمات واقعي تحليلگران اعتباري باشد. در اينجا هدف سيستم تقليد از تصميم گيرنده انساني در اعطا يا رد اعتبار و تعيين نقض‌هاي اعتباري است.
ب ـ نهادهاي مالي
1ـ ارزيابي خطر وام‌دهي، ورشكستگي: موسسات نيز مي‌توانند به كمك سيستم‌هاي عصبي در مورد بررسي تقاضاي وام و تصميم در مورد پرداخت يا عدم پرداخت تصميم بگيرند.
2ـ مديريت بدرة دارايي‌ها و اوراق بهادار: موسسات مالي بايستي گلچيني از سهام، اوراق قرضه، وام‌هاي رهني، دارايي هاي فيزيكي را انتخاب كنند. با توجه به نوسانات دائم اقتصادي و مالي اين كار بسيار مشكل است. با عنايت به ماهيت سازمان نايافته فرآيند مديريت بدره101 و عدم اطمينان از اوضاع اقتصادي و پراكندگي و كمبود اطلاعات، عرصه مناسبي براي طراحي مدل‌هاي شبكه عصبي در اين زمينه بوجود آمده است.
3ـ قيمت گذاري اوراق بهادار جديد: موسسات تامين مالي102 در كشورهايي با بازار سرمايه توسعه يافته، قيمت گذاري اوراق بهادار جديد را انجام مي‌دهند. اينكار فرايند پيچيده‌اي است كه بر نرخ بازده شركت تأثيري مستقيم دارد. اطلاعات مربوط به صادر كنندگان اوراق ممكن است ناقص باشد، يا فرم عرضه اطلاعات غير استاندارد باشد. ولي باز هم مي‌توان براي اين قيمت گذاري از شبكه‌هاي عصبي استفاده كرد. به طور مشابه اين كار را مي‌توان در مورد قيمت گذاري اوليه سهام نيز انجام داد.
مراحل طراحی و اجرای مدل در شبکه های عصبی به شرح زیر انجام می شود :
همه داده ها را در یک جا جمع می کنیم.
داده ها را به دو گروه داده های آزمونی و داده های یادگیری تقسیم می کنیم.
داده ها را به شکل ورودی های مناسب برای ورود به سیستم تبدیل می کنیم.
معماری شبکه را انتخاب می کنیم، آموزش می دهیم و سپس آزمون می کنیم. سه مرحله فوق را هر مقدار لازم است، تکرار می کنیم.
از شبکه حاصلی استفاده می کنیم.
شبکه های عصبی را می توان با توجه به معیارهای زیر تقسیم کرد (ماندیک103،2001، 2)
مدل محاسباتی
قواعد یادگیری (یادگیری با سرپرست104، بدون سرپرست105، زوجی106 )
معماری شبکه (شبکه های پیش رو و پسرو)
3-8-2 : ماشین بردارپشتیبان
در سال 1965 محققی روسی به نام ولادیمیر وپنیک گامی بسیار مهم در طراحی طبقه بندی- کننده ها برداشت. وی نظریه آماری یادگیری را به صورت مستحکم تری بنا نهاد و ماشینهای بردار- پشتیبان را بر این اساس ارائه داد.
در هنگام تلاش برای کشف الگوها و مدل های طبقه بندی ، یادگیری ماشین می تواند یک ابزار قوی بشمار رود (جانا و ماتجاز107،2001، 8). ماشین بردار پشتیبان در واقع یک طبقه بندی کننده دودوئی است که دو کلاس را با استفاده از یک مرز خطی از هم جدا می کند. در این روش با استفاده از تمامی باند ها و یک الگوریتم بهینه سازی ، نمونه هایی که مرز ها ی کلاسها را تشکیل می دهند به دست می آورند (وپنیک و چروننکیس108،1991، 15).
در این روش مرز خطی بین دو کلاس به گونه ای محاسبه می شود که :
1- تمام نمونه های کلاس +1 در یک طرف مرز و تمام نمونه های کلاس -1 در طرف دیگر مرز واقع شوند.
2- مرز تصمیم گیری به گونه ای باشد که فاصله نزدیکترین نمونه های آموزشی هر دو کلاس از یکدیگر در راستای عمود بر مرز تصمیم گیری تا جایی که ممکن است.
این متد شبیه به شبکه های عصبی است که به جای خط جدا کننده، بدنبال بهترین خط جدا- کننده ای است که دارای حداکثر حاشیه109 باشد. یعنی بهترین خط جدا کننده ای که با نزدیکترین نقطه، کمترین فاصله را داشته باشد. حداکثر کردن حاشیه ابر صفحه ، بردار های پشتیبان اطلاق می گردد. حداکثر کردن حاشیه ابر صفحه منجر به حداکثر شدن تفکیک بین طبقات می شود. تنها از این بردار (نقاط) برای مشخص کردن مرز بین طبقات استفاده می شود (کیونگ،تایک،هیونگ110،2005، 130).
اگر داده ها به صورت خطی مجزا ازهم باشند، ماشین بردار پشتیبان به ماشین های خطی برای تولید یک سطح بهینه که داده ها را بدون خطا و با حداکثر فاصله میان صفحه و نزدیکترین نقاط آموزشی (بردارهای پشتیبان) تفکیک می نماید، آموزش می دهد. اگر نقاط آموزشی را به صورت [x_(i ) و〖 y〗_i ] و بردار ورودی i=1,….Iو{1و1-} ∈ y_(i ) تعریف می کنیم، آنگاه در حالتی که داده ها به صورت خطی قابل تفکیک هستند، قواعد تصمیم گیری که تعریف می شود و توسط یک صفحه بهینه که طبقات تصمیم گیری باینری را تفکیک می کند، به صورت معادله زیر است :
رابطه 3-2 : تابع تصمیم گیری در حالت خطی
y = sign { ∑_(I=1)^N▒〖〖 y〗_i α_(i ) 〗 ( X*X )+b}
که در آن Y خروجی معادله، 〖 y〗_iارزش طبقه نمونه آموزشی x_(i ) و * نشان دهنده ضرب داخلی است. بردار X = (〖 x〗_1,x_2,…,x_n) نشان دهنده یک داده ورودی و بردارهای X_(i ) و i=1,2,….,N بردارهای پشتیبان هستند. در معادله فوق، پارامترهای α_(i ) و b تعیین کننده ابر صفحه هستند.
اگر داده ها به صورت خطی قابل تفکیک نباشند، معادله فوق به معادله زیر تغییر می یابد :
رابطه 3-3 : تابع تصمیم گیری در حالت غیر خطی
Y = sign { ∑_(I=1)^N▒〖〖 y〗_i α_(i ) 〗 K( X و 〖 X〗_i )+b}
تابع K( X و 〖 X〗_i ) ، تابعی کرنلی است که برای ایجاد ماشین هایی با انواع مختلفی از سطوح تصمیم گیری غیر خطی در فضای داده ها، ضرب های داخلی تولید می کند.(وانگ111،2005، 8)
در ماشین بردارپشتیبان انتخاب بهینه ویژگی ها در دقت مدل تأثیر بسزایی دارد از این رو در سالهای گذشته بسیاری از تحقیقات بر روی ماشین بردارپشتیبان، بر روی انتخاب بهینه پارامترها متمرکز میباشند.
تعدادی از نقاط آموزشی که کمترین فاصله تا مرز تصمیم گیری را دارند می توانند به عنوان زیر مجموعه ای برای تعریف مرزهای تصمیم گیری و به عنوان بردار پشتیبان در نظر گرفته شوند. این تکنیک به صورت موفق برای مشکلاتی که برای طبقه بندی الگوهای مختلف وجود دارد ، به کار گرفته می شود. این روش نیازمند حل مشکل بهینه سازی درجه دوم و نیاز زمان آموزش است.
برای بهبود عملکرد دسته بندی کننده بهتر است تا ویژگی های مهم را انتخاب کرده و از پرداختن به ویژگی های کم اهمیت اجتناب گردد. نکته ای باید در اینجا متذکر شد این است که انتخاب ویژگی های مستقل از الگوریتم یادگیری است که در ساختارهای دسته بندی، الگوریتم انتخاب زیرمجموعه ای از ویژگی ها را می توان به دو دسته تقسیم بندی کرد: روش فیلتر و روش وارپر. در روش فیلتر112 ابتدا ویژگی های مهم انتخاب شده، سپس از ماشین بردار پشتیبان برای دسته- بندی استفاده می شود در روش وارپر113 مهمترین ویژگی ها برای هر دو مجموعه تست و آموزش یا ترکیب هردوی این ها به همراه ابزارهای بهینه سازی دیگر جهت انتخاب ویژگی ها در نظر گرفته میشود(چنگ و همکاران114،2006، 852)
ماشین های بردار پشتیبان دارای خواص زیر هستند :
1- طراحی طبقه بندی کننده با حداکثر تعمیم 2- رسیدن به نقطه بهینه کلی تابع 3- تعیین خودکار ساختار و توپولوژی بهینه برای طبقه بندی کننده 4- مدل کردن توابع تمایز غیر خطی با استفاده از هسته های غیر خطی و مفهوم حاصل ضرب داخلی در فضاهای هیلبرت.
تکنیک های یادگیری ماشینی بخشی از علم هوش مصنوعی به شمار می آیند. ماشین بردار- پشتیبان به طور مؤثر و موفق در گستره وسیعی از شاخه های تجاری همچون بازاریابی، حسابداری، سیستم های اطلاعاتی مدیریت و مدیریت تولید، مدیریت مالی مانند رتبه بندی اعتباری و پیش بینی سری های زمانی مالی، بکار گرفته می شود. در اکثر تحقیقات در سالهای اخیر از روش های یادگیری ماشینی برای پیش بینی تغییرات آتی سهام، بحران های مالی، ورشکستگی، شناسایی کلاهبرداری کارت های اعتباری بکار گرفته شده است.
3-8-3 : درخت تصمیم
درختان تصمیم از سال 1980 مطرح شدند و در جهت توسعه مدلهای رتبه بندی اعتباری مورد استفاده قرار گرفتند. درختان تصمیم به عنوان یک ابزار قدرتمند و قابل انعطاف در دسته بندی محسوب می شوند(دیویس و گامرمن115،1992، 48). ماکوسکی116 (1985) از اولین کسانی است که روش درخت طبقه بندی را در اندازه گیری اعتبار به کار گرفت.
متداول ترین وظیفه داده درخت تصمیم گیری، کلاس بندی می باشد. مقصود اصلی در درخت تصمیم گیری، تقسیم داده ها به صورت بازگشتی به زیرمجموعه هایی است به گونه ای که هر زیرمجموعه در برگیرنده وضعیت همگنی از متغیر هدف می باشد. در هر تقسیم درخت، تمام مشخصه های ورودی به منظور تأثیرشان بر روی مشخصه های قابل پیش بینی به صورت بازگشتی ارزیابی می شوند. زمانی که پردازش بازگشتی کامل شد، درخت تصمیم گیری شکل گرفته است.
در رتبه بندی اعتباری از درختان باینری استفاده می شود، چرا که در آن مشتریان در دو دسته قرار میگیرند.
درختان تصمیم گیری تنها مقادیر ویژگی های گسسته را توسط متغیر هدف (ویژگی کلاس یا ویژگی وابسته) پیش گویی می کند. این پیش گویی توسط متغیر کلاس که ویژگی هدف یا ویژگی وابسته نیز نامیده می شود، صورت می گیرد. مقادیر ویژگی هدف، وابسته به مقادیر متغیرهای (ویژگیهای) مستقل (توصیف کننده) و وجود آنها در ساختار درخت تصمیم گیری است.(هیگر و پاو117،2003، 6)
در طبقه بندی نمونه به روش درخت تصمیم گیری، به این صورت عمل نمی شود که امتیازی به هر شاخص داده شده و سپس مقادیر شاخص ها با هم جمع شود. در مقابل در این روش، مشتریان به گروه هایی تقسیم می شوند که هر گروه در داخل خود از نظر ریسک قصور در اعتبار کاملاً همگن می باشد و بین گروه ها نیز از حیث ریسک قصور در اعتبار، ناهمگنی زیادی مشاهده می شود. درخت تصمیم گیری بر خلاف شبکه های عصبی به تولید قانون می پردازد. یعنی درخت تصمیم گیری پیش بینی خود را در قالب یک سری قوانین توضیح می دهد در حالیکه در شبکه های عصبی تنها پیش بینی نهایی بیان می شود و چگونگی آن در خود شبکه پنهان باقی میماند.(کارپتین118،1999، 110)
محققینی نظیر کافمن119 (1986) روش درخت طبقه بندی را با روش تجزیه و تحلیل تشخیص مقایسه کرده و به این نتیجه رسید که درخت طبقه بندی زمانی بهتر است که میان متغیرها تعامل وجود داشته باشد.
به طور کلی می توان مزایای استفاده از روش درخت تصمیم نسبت به سایر تکنیک های داده کاوی را به شرح زیر بیان نمود :
نسبت به سایر مدل های دسته بندی، زودتر محاسبه می گردد. 2- معمولاً دقت آن نسبت به سایر مدل ها بهتر است. 3- برای یاد گیری ساده و آسان است. 4- قانون های بدست آمده در آن راحت تر درک می شود. 5- مزیت الگوریتم درخت تصمیم گیری نسبت به سایر الگوریتم های داده کاوی این است که مدل آن سریعتر ساخته و آسان تر تفسیر می شود. 6- پیش بینی ها بر اساس درخت تصمیم گیری مؤثر و کارآمدترند.
یکی از محدودیتهای این روش، ناپایداری آن می باشد. بدین صورت که

پایان نامه
Previous Entries پایان نامه ارشد درباره شبکه های عصبی، شبکه عصبی، شبکه های عصبی مصنوعی Next Entries پایان نامه ارشد درباره وضعیت مالی، تسهیلات مالی، صورتهای مالی