مقاله درمورد الگوریتم ژنتیک، شبکه های عصبی، شبکه عصبی، مدل ترکیبی

دانلود پایان نامه ارشد

استخراج قانون(ExtractionRule ) از شبکه های عصبی با استفاده از الگوریتم ژنتیک نتیجه قابل قبولی برای پیش بینی قیمت سهام بدست می دهد.
فرضیه4) مدل ترکیبی ARIMA، شبکه عصبی درک چند لایه و تبدیل موجک نتیجه قابل قبولی برای پیش بینی قیمت سهام بدست می دهد.
فرضیه5) مدل ترکیبی تبدیل موجک، شبکه عصبی درک چند لایه و الگوریتم ژنتیک فازی در مقایسه با سایر مدلها ارائه شده از دقت بالاتری برخوردار است.

1-6: روش انجام تحقیق
هدف اصلی تحقیق حاضر، پیش بینی قیمت سهام با استفاده از مدل سری زمانی خطی ARIMA و شبکه عصبی و همچنین ترکیب شبکهی عصبی درک چندلایه یا تکنیک استخراج قانون از شبکه های عصبی با استفاده از الگوریتم ژنتیک و استفاده از تبدیل موجک برای ترکیب مدل خطی ARIMA و شبکه عصبی و همچنین استخراج قانون از مدل ترکیبی تبدیل موجک عصبی و تعیین مدل بهینه با مقایسه نتایج حاصل از روشهای پیشبینی مورد استفاده است. تبدیل موجک، شبکه های عصبی و الگوریتم ژنتیک از جدیدترین و پیشرفته ترین روش های مدلسازی و پیش بینی است که چندی است از این روش ها برای پیش بینی فاکتورهای حسابداری و مالی نیز استفاده می شود. در این پژوهش ابتدا پیش بینی شاخص قیمت با استفاده از مدل سری زمانی ARIMA صورت گرفت، سپس این پیشبینی با استفاده از شبکه عصبی مصنوعی تکرار شد، در مرحله سوم برای بدست آوردن الگوی شبکه عصبی از الگوریتم ژنتیک فازی استفاده شد، سپس با استفاده از تبدیل موجک سری زمانی تا سه مرحله شکافته شد، با در نظر گرفتن این نکته که مدلهای خطی در سریهای هموار نتایج بهتری دارند؛ سری همار شده با استفاده از مدل خطی ARIMA پیشبینی شد و سری تابع جزئیات با استفاده از شبکه عصبی مصنوعی در انتهای این مرحله با استفاده از معکوس تبدیل موجک پیشبینیهای صورت گرفته با هم ترکیب شده و پیشبینی سری اصلی حصل گردید و در نهایت در الگوریتم استخراج قانون از شبکههای عصبی(الگوریتم ژنتیک فازی) به جای شبکه عصبی از مدل ترکیبی تبدیل موجک و شبکه عصبی استفاده گردید. در ادامه روشهای مورد استفاده برای پیش بینی به تفکیک توضیح داده می شود.

1-6-1: مدل ARIMA
یک سری زمانی، دنباله ای از مشاهدات منظم شده بر حسب زمان از یک متغیر می باشد. در تجزیه و تحلیل سریهای زمانی تنها از دادههای تاریخی متغیری که پیشبینی می شود، استفاده می کنند تا مدلی برای تخمین مقادیر آینده توسعه دهند. پیش بینی بارزترین مورد استفاده از سری زمانی میباشد، اینکار در صنعت و اقتصاد از اهمیت بالایی برخوردار است. از روشهای پیش بینی سری زمانی که در پشبینی کاربرد بسیاری دارد مدل ARIMA میباشد، ولی همانند سایر مدلهای پیش بینی این مدل نیز دارای محدودیتهایی می باشد که در ادامه به برخی از آنها اشاره میشود:
در حال حاضر در مدل ARIMA روش مناسبی وجود ندارد که به محض اینکه مشاهده جدید در دسترس قرار گرفت تخمینهای پارامترهای مدل را اصلاح یا به روز نماید، و تحلیل گر ناگزیر است بطور کامل مدل را از نو برازش نماید. و همچنین پژوهشگر باید فرض نماید که تکامل آینده سری زمانی با گذشته یکسان خواهد بود، یعنی شکل مدل با زمان تغییر نخواهد کرد. عدم امتیاز نهایی مدلهای ARIMA سرمایهگذاری مورد نیاز در زمان و سایر منابع برای ساختن یک مدل رضایت بخش است. ولی این مدلها بخصوص برای سریهای زمانی که در آنها فاصله نمونه گیری خیلی کوچکند، بدلیل اینکه تاریخ نسبتا طولانی یی را به آسانی میتوان تهیه کرد، به نحو شایستهای مناسبند.(فاطمی،1375)

1-6-2: شبکه عصبی مصنوعی
شبكه هاي عصبي مصنوعي8 ابزار مدل بندي انعطاف پذير و غير پارامتريك هستند. آنها مي توانند هر تابع پيچيده اي را با دقت مورد نظر اجرا كنند. يك شبكه عصبي مصنوعي نوعا از چندين لايه متشكل از تعدادي زيادي عناصر محاسبه گر ساخته شده است كه اين عناصر محاسبه گر اصطلاحا گره مينامند. هر گره يك سيگنال ورودي از ديگر گره ها، يا ورودي هاي خارجي دريافت ميكند و پس از پردازش سيگنالها بصورت محلي به واسطه يك تابع تبديل به گره ديگر يا نتيجه نهايي ارسال مي كند. لایهی ورودی9 و لایهی خروجی10 شبکه شبیه یک سیستم ورودی-خروجی عمل میکند و ارزش نرون های ورودی را برای محاسبهی ارزش نرون خروجی مورد استفاده قرار می دهد. شبکه های عصبی با لایه های پنهان11 دارای توانایی های بیشتری نسبت به شبکه های عصبی دو لایه هستند.(منهاج،1377) در شبکههای عصبی ورودی p به نرون اعمال شده از طریق ضرب در وزن w، وزندار میشود و حاصل به تابع انتقال f بعنوان ورودی اعمال شده و خروجی نهایی حاصل میگردد. که در آن اندازهی w متناظر با قدرت هر اتصال سیناپسی12(به نقطه اتصال یک آکسون13 یک سلول عصبی با دندریت14 سلولهای عصبی دیگر) در نرونهای موجودات زنده میباشد.(مصطفی کیا،1388) بعبارتی شبکه عصبی وزن بین متغیرهای مستقل و وابسته یعنی میزان رابطه بین آنها را تعیین می نماید.
1-6-2-1: شبکهی عصبی درک چند لایه (MLP)
پرکاربردترين معماري شبکه هاي عصبي، شبکه هاي چند لايه پيش خور15 هستند که معمولا” شبکه هاي درک چند لايه و به طور اختصار 16MLPگويند. اين نوع شبکه ها داراي مشخصات زير هستند:
١. پردازنده هاي شبکه به چند لايه مختلف تقسيم مي شوند.
٢. حداقل تعداد لايه ها در اين شبکه ها، ٢ است.
٣. پردازنده هاي هر لايه فقط مجاز به دريافت سيگنال از پردازنده هاي لايه قبل خود هستند و سيگنال خروجي اين پردازنده نيز به پردازنده هاي بعدي اعمال مي شود.
٤. در اين شبکه ها به لايه اول، ورودي، به لايه آخر، خروجي و به لايه هاي مياني ، لايه هاي پنهان مي گويند. ورودي هاي شبکه پارامتر هاي مؤثر در تعيين خروجيها هستند. بنابراين تعداد گره هاي لايه ورودي و خروجي در حقيقت از همان آغاز استفاده از شبکه معلوم است. تعداد گره هاي لايهی پنهان و همچنين تعداد لايه هاي پنهان از طريق سعي و خطا بدست مي آيد. در حقيقت تعداد مناسب گره ها و لايه هاي پنهان، وقتي به دست مي آيد که شبکه بهترين جواب را ارائه دهد.(منافی،1385)
علت اصلي موفقيت اين شبكه را بايستي در نوع الگوريتم يادگيري اين شبكه جستجو كرد. الگوريتم مورد استفاده در آن ، الگوريتم پس انتشار خطا مي باشد. اين الگوريتم همواره به دنبال حداقل سازي مربعات خطا مي باشد . اين دقيقا شبيه تخمين ضرايب رگرسيون از روش OLS در آمار و اقتصاد سنجي مي باشد . بنابراين هر شبكه عصبي از يك تابع خطايي همانند رابطه زير پيروي مي كند .
تابع خطا در شبكه MLP :
(1-1)
در اين رابطه e بيانگر مقدار خطاي مشاهده شده مي باشد .
هنگام طراحي يک شبکه بايد پارامترهاي ساختار شبکه، نوع الگوريتم آموزش، نرخ يادگيري، تعداد لايه هاي شبکه و تعداد نرون ها در هر لايه، و تعداد تکرارها براي هر الگو در خلال آموزش را مد نظر داشت.(اعظمی،1388)
از آنجاییکه عمل پیش بینی در شبکه های عصبی از طریق یادگیری17 بر روی متغیرهای ورودی انجام می شود، از این رو متغیرهای ورودی یکی از موارد مهم در مدلسازی با استفاده از شبکه های عصبی و الگوریتم ژنتیک است. از آنجا که بهترین وضعیت برای شبکههای عصبی هنگامی است که تمام ورودیها و خروجیها بین صفر و یک باشند لذا داده ها با استفاده از روش ساعتی نرمال شدند. بدین منظور با جمع آوری منابع داخلی و خارجی با استفاده از روش کتابخانه ای و مطالعه ادبیات تحقیق، چهار متغیر به عنوان متغیرهای ورودی مدل در نظر گرفته شدند:
متغیر های ورودی(مستقل) مورد استفاده در تحقیق
X
شناسه
متغیر
1
GP
قیمت جهانی طلا
2
OP
میانگین قیمت نفت ایران
3
USD
نرخ دولتی دلار آمریکا
4
S&P500
شاخص S&P500 آمریکا (نماد بورس جهانی)

مدل دارای یک متغیر خروجی (وابسته) است، و آن هم شاخص قیمت (TEPIX) خواهد بود. داده های روزانه کلیه متغیرهای فوق از تاریخ 06/01/1384لغایت 28/12/1389، مورد بررسي قرار می گیرد. لذا جامعه آماری بورس اوراق بهادار تهران و سال های 1384 لغایت 1389 به عنوان دوره زمانی تحقیق انتخاب شد.
1-6-3: الگوریتم ژنتیک
الگوریتم ژنتیک الهام گرفته از طبیعت است و تکامل طبیعت با فرضیه داروین، اساس شکل گیري آن می باشد که درآن بهترین ها حق بقا دارند.الگوریتم ژنتیک توسط جان هالند 18متخصص علوم کامپیوتر دانشگاه میشیگان در سال1962 ارائه شد. هالند با ارائهی رساله ای با عنوان« تطابق در طبیعت و سیستمهاي مصنوعی» به معرفی مفاهیم اصلی GA شامل عملگرهای سه گانهی انتخاب19، آمیزش20 و جهش21 که در مورد سیستمهای مصنوعی به کار میروند و همچنین مبانی ریاضی الگوریتم ژنتیک پرداخت.(شهابیان و همکاران،1387)
از اين الگوريتم، درحل مسائل بهينه سازي پيچيده كه نمي توان براي آن قوانين خاصي در نظر گرفت استفاده مي شود. براي حل يك مسئله با استفاده از اين روش ابتدا بايد پاسخهاي فرضي مسئله را به صورت خاصي نمايش داد كه براي ادامه كار و ارزيابي پاسخها مشكلي ايجاد نگردد. روشهاي متعددي براي نمايش و كدگذاري وجود دارد كه از مهمترين و معمولترين آنها روش دودويي و نمايش اعشاري شناور مي باشد.(ستایش و همکاران، 1388)
در آغاز، جمعيت اوليه كه جواب ها را نشان مي دهند به صورت تصادفي انتخاب مي گردد. هر يك از اعضاي اين جمعيت كه كروموزم ناميده مي شود يكي از پاسخ هاي مسئله مي باشد. هر يك از اين كروموزم ها از رشته اي از اعداد با طول برابر انتخاب مي گردد كه هر يك از اين اعداد ژن نام دارد. الگوريتم ژنتيك بر اساس تكرار عمل مي كند كه به جمعيت در هر مرحله ، نسل گفته ميشود. هريك از اعضاي اين نسل بر اساس تابع ارزش ، ارزيابي مي شوند. در اين الگوريتم ها نسل جديد سعي دارد كه ارزش بيشتري از تابع ارزش را به خود اختصاص دهد و با اين عملكرد به تابع هدف نزديك تر گردد. در هر مرحله از تكرار، هر يك از كروموزم ها با احتمال خاصي با يكديگر عمل تقاطعي انجام مي دهند يا به اصطلاح مزدوج مي شوند كه پيامد آن يك يا چند كروموزم جديد به نام فرزند مي باشد.
در اين فرزندان ممكن است طبق احتمال خاصي عمل جهش ژني اتفاق افتد، به اين صورت كه مقدار يك يا چند ژن از كروموزم تغيير كند. در مرحله آخر فرزندان طبق تابع ارزش، ارزيابي شده و بر اساس ارزش آنها و ارزش والدين يعني نسل اوليه كه اين فرزندان را توليد كرده اند نسل جديد توليد خواهد شد. اين مراحل تا جايي تكرار ميشود كه نسل حاضر به جواب بهينه يا يكي از زير جوابهاي بهينه همگرا گردد.(ایبن و اسمیت22،2003)

1-6-3-1: استخراج قانون از شبکهی عصبی با استفاده از الگوریتم ژنتیک
عیب مهم و اساسی شبکههای عصبی مصنوعی، عدم توانایی در توضیح و تفسیر است.(اندرسون23 و همکاران،1996) اگر چه شبکه های عصبی در بسیاری از کاربردهای خود، موفقیت آمیز بوده است، اما دانش مربوطه در توابع انتقال و وزن های نرون ها مخفی می شوند.(بولوگنا24،2004) به هرحال آنها مشابه جعبه های سیاه ممتد هستند که فهم روش حل یک مسئله توسط شبکه های عصبی را دشوار کرده است.(مانتاس25 و همکاران،2006) بنابراین اطلاعاتی که توسط شبکهی عصبی برای دست یابی به پاسخ، بکار گرفته شده است، برای کاربران شفاف نیست و ممکن است در برخی موارد مسئله ساز شود(هوانگ و ژینگ26،2002).
برای حل این مسئله، محققان مایل بودند که یک تکنیک ملموس و قابل فهم برای شبکه های عصبی ایجاد نمایند.آنها اعتقاد داشتند این هدف می تواند با استخراج قانون تولید شده از شبکه های عصبی بدست آید(هوانگ و ژانگ،2002).
از یک دیدگاه می توان تکنیک های استخراج قانون را به سه دسته تقسیم کرد: تجزیه ای27، مبتنی بر آموزش28 و منتخبان29. روش تجزیه ای فعالیت و وزن های لایهی پنهان را تجزیه و تحلیل می کند؛ در مقابل، روش مبتنی بر آموزش، شبکهی عصبی را به عنوان یک جعبهی سیاه در نظر گرفته و قوانین را با توجه به فعالیت ورودی و خروجی بدس

پایان نامه
Previous Entries مقاله درمورد قیمت سهام، شبکه عصبی، الگوریتم ژنتیک، ارزیابی عملکرد Next Entries مقاله درمورد بورس اوراق بهادار، بورس تهران، بازار اوراق بهادار، بورس اوراق بهادار تهران