دانلود پایان نامه ارشد با موضوع اتوماتاي، يادگير، تحقيقات

دانلود پایان نامه ارشد

يا نيروهاي خودي از شبكه‌هاي حسگر استفاده نمود.
شناسايي محيطهاي آلوده:
در محيطهاي مختلف امکان وجود آلودگيهاي مختلفي است. لذا با استفاده از چنين شبکههائي ميتوان وجود آلودگيهاي مشخصي را در سطح محيط تحت نظر، چک کرد و حتي ميزان غلظت آلودگي در قسمت‌هاي مختلف را بررسي نمود.

شکل ‏6-3 : نمونه کاربردهاي شبکههاي حسگر بيسيم
نظارت بر محيط زيست:
از ديرباز انسان به دنبال كشف مجهولات و زيباييهاي جهان بوده است. بسياري از تحقيقات در زمينه محيط زيست نيازمند انجام مطالعات مكرر و متمركز و صرف زمان زيادي جهت جمعآوري اطلاعات ميباشد كه معمولا از حوصله و توانايي انسان خارج ميباشد. لذا مي‌توان در اينگونه تحقيقات از دستگاههاي ديدهباني، تحليلگر و ذخيره كننده نتايج استفاده كرد. ازسوي ديگر، به خاطر وجود برخي شرايط محيط زيست اكثر كارهاي تحقيقاتي بايد در سكوت و آرامش صورت گيرد تا وجود انسان و تجهيزات در محيط اثر منفي در عملكرد غريزهاي و واقعي موجودات نداشته باشد و موجب كاهش كيفيت تحقيق نگردد. از اين رو معمولا تمام سيستمهاي نظارتي قابليت كنترل از راه دور را دارند. در عين حال سيستمها طوري انتخاب ميگردد كه وجود آن در محيط محسوس نباشد. با در نظر گرفتن تمام موارد فوق ملاحظه ميشود كه شبكههاي حسگر علاوه بر هزينه پايين مصرفي در زمينه نظارت بر محيط زيست از توانايي بالايي برخودار ميباشند. همانطور که در قسمتهاي (پ) و(ت) شکل 2-7 ديده ميشود، كوچك بودن گرههاي حسگر، قابليت قرار گرفتن در هر گوشه كناري حتي لابلاي برگ درختان، كسب اطلاعات در حد جزئيات زياد، نداشتن تاثيرات مضر زيست محيطي، ذخيره اطلاعات در صورت اتفاق افتادن رخداد مدنظر و عدم تداخل با ساير سيستمهاي مخابراتي ميتواند دلايل مناسبي جهت توجيه استفاده از شبكههاي حسگر نسبت به ساير سيستمهاي مشابه در اينگونه كاربردهاي نظارتي باشد. در مواردي همچون بررسي وضعيت آب و هواي جوي محيط، بررسي وضعيت ظاهري محيط بخصوص محيط سرسبز و جنگلي، بررسي رشد و نمو گياهان و موجودات، موقعيتيابي و پيگيري موجودات معين در محيط زيست ميتوان از قدرت بالاي شبكههاي حسگر در امر نظارت استفاده كرد.
بررسي و تحليل وضعيت بناهاي ساختماني:
بسياري از سازمانها و موسسات تحقيقاتي در زمينه عمران و مسکن براي انجام مطالعات و تحقيقات خود از وضعيت بناهاي مدنظر در طول زمان يا در هنگام بروز حوادث طبيعي بخصوص زلزله نيازمند استفاده از تجهيزات نظارتي ميباشند تا اطلاعاتي مانند ميزان فشار و تحمل مصالح، وجود ترک، ميزان آسيب وارده، وضعيت فرسودگي، امنيت و حفاظت ساختمان و ساير جزئيات مرتبط با هدف تحقيقات را در مورد بناهائي مثل ساختمانهاي قديمي، پلها، سدها، موزهها و… جمع آوري کنند (قسمت (ث) شکل 2-7). با توجه به تواناييهاي شبکههاي حسگر ميتوان مدعي شد که اين سيستم بهترين و کارسازترين تکنيک در اين زمينه تحقيقات ميباشد.
در جادهها و بزرگراههاي هوشمند:
امروزه يکي از مشکلات بزرگ شهري، کنترل وضعيت ترافيک در سطح شهر ميباشد. همانطور که در قسمت (ج) شکل 2-7 ديده ميشود با برپايي شبکهاي از گرههاي حسگر در سطح شهر و قرار دادن گرهها در بزرگراهها و خيابانهاي شهر ميتوان بزرگراهها و خيابانها را هوشمند ساخت و از وضعيت تراکم عبور و مرور وسايل نقليه و يا بروز حوادث در نقاط تحت نظر گرههاي حسگر، اطلاع يافت و در نهايت در کل سطح شهر وضعيت ترافيک و تصادفات را شناسايي و پيگيري نمود .

کاربردهاي مختلف در زمينه پزشکي:
در زمينه بررسي و مطالعات پزشکي در مورد موجودات و يا گياهان جهت آگاهي از وضعيت جسماني ميتوان از گرههاي حسگر استفاده نمود. اين استفاده مي‌تواند در موارد مختلفي از جمله قرار دادن گرهها در لايههاي زير پوست براي انجام مطالعات مکرر در طي مدت نسبتاً طولاني، دستگاههاي پزشکي و بخصوص در زمينه فيزيک پزشکي و … باشد.
7-
پيوست دوم:آتوماتاي يادگيرسلولي
در اين فصل راجع به تاريخچه اتوماتاي يادگير ، رفتار آن، الگوريتمهاي يادگيري براي آن و انواع آتوماتاي يادگيرسلولي توضيحاتي ارائه مي شود.
7-1- تاريخچه آتوماتاي يادگير
در دهه 1960 ميلادي، سيپکين86 روشي براي ساده کردن مسائل فوق به مسأله‌اي براي تشخيص پارامترهاي بهينه و بکاربردن روشهاي تپه نوردي براي حل آن معرفي کرد[98]. ستلين87و همکارانش در همان زمان کار بر روي اتوماتاي يادگير را آغاز کردند. مفهوم اتوماتاي يادگير نخستين بار توسط وي مطرح شد[99]. ستلين به مدل‌سازي رفتارهاي سيستمهاي بيولوژيکي علاقمند بود و يک اتوماتاي قطعي که در محيطي تصادفي فعاليت مي‌کرد را بعنوان مدلي براي يادگيري معرفي نمود. در تحقيقات انجام شده بعدي، استفاده از يادگيري در سيستمهاي مهندسي نيز در نظر گرفته شد. رويکرد ديگري که توسط نارندرا88 و ويسواناتان89 ارائه شد[100]، در نظر گرفتن مسأله بصورت پيدا کردن عمل بهينه از ميان مجموعه‌اي از عملهاي مجاز يک اتوماتاي تصادفي بود. تفاوت دو روش اخير در اينست که در روش اول در هر تکرار، فضاي پارامترها بِروز مي‌شود اما در روش دوم فضاي احتمال بِروز مي‌گردد. پس از آن اکثر کارهاي انجام شده در تئوري اتوماتاي يادگير، در ادامه مسير معرفي شده توسط ستلين انجام شدند. وارشاوسکي90 و وورونتسوا91 اتوماتاي يادگير با ساختار متغير را مطرح کردند که احتمالات عملهاي92 خود را بِروز مي‌کرد و درنتيجه باعث کاهش تعداد حالات نسبت به اتوماتاي قطعي مي‌شد[101].
نخستين تلاشها براي استفاده از اتوماتاي يادگير در کاربردهاي کنترلي توسط فو93 و همکارانش انجام شد. از جمله اين کارها مي‌توان به کاربردهايي از اتوماتاي يادگير در تخمين پارامترها94، تشخيص الگو95 و تئوري بازي96 اشاره کرد[102,103,104,105]. مک‌لارن97 روشهاي بِروز رساني خطي و ويژگيهاي آنها را بررسي نمود[106] و پس از آن چاندراسکاران98 و شن99 روشهاي بِروزرساني غير خطي را بررسي کردند[107]. کتاب نارندرا و تاتاچار100 تحت عنوان “Learning Automata: An Introduction” است که کليه تحقيقات انجام شده تا اواخر دهه 1980 را در بر مي‌گيرد‎[15]. مثالها و کاربردهاي متعدد ديگري از اتوماتاي يادگير نيز توسط نجيم101 و پوژنياک102 در کتابي با عنوان”Learning Automata: Theory and Application” ارائه شده است[108].
نتايج اين تحقيقات به استفاده از اتوماتا بعنوان مدلي از يادگيري با کاربردهايي در مسيريابي شبکه‌هاي تلفن، تشخيص الگو و کنترل تطبيق‌پذير منجر شد [16,21,109]. علاوه بر اين از کاربردهاي اخير اتوماتاي يادگير در مسائل واقعي مي‌توان به تشخيص الگو[110]، جداسازي گراف[111]، برنامه‌ريزي مسير103‎[112]اشاره کرد. ديگر کاربردهاي اتوماتاي يادگير در[3,113,114,115,116] ارائه شده‌‌اند.
7-2- معيار‌هاي رفتار اتوماتاي يادگير
براي اندازه‌گيري کارايي اتوماتاي يادگير تصادفي، شاخصهاي معيني تعريف شده‌اند که امکان مقايسه روشهاي مختلف يادگيري را فراهم مي‌آورند‎[15]. يک اتوماتاي شانسي محض بصورت اتوماتايي تعريف مي‌شود که عملهاي آن هميشه احتمال يکساني براي انتخاب شدن داشته باشند. بنابراين يک اتوماتاي يادگير بايد از يک اتوماتاي شانسي محض بهتر عمل کند.
همانطور که ذکر شد، محيط توسط احتمالات جريمه نشان داده مي‌شود که احتمال جريمه متناظر با عمل است. مقدار بصورت ميانگين جريمه‌هاي دريافت شده توسط اتوماتا (براي يک بردار عمل مفروض) تعريف و بر اساس رابطه(7-1) محاسبه مي‌شود.
(‏7-1)

براي يک اتوماتاي شانسي محض ميانگين جريمه‌‌ها M(n) يک عدد ثابت است که طبق رابطه (7-2) بدست مي‌آيد:
(‏7-2)

بنابراين اتوماتايي که بخواهد بهتر از اتوماتاي شانسي محض عمل کند، بايد ميانگين جريمه‌هاي کمتري از داشته باشد. از آنجايي که يک متغير تصادفي است، اميد رياضي () با مقايسه مي‌شود. بنابراين تعاريف زير را خواهيم داشت.
تعريف1- يک اتوماتاي يادگير expedient گفته مي‌شود، اگر:
(‏7-3)

تعريف2- يک اتوماتاي يادگير بهينه104 گفته مي‌شود، اگر:
(‏7-4)

که . در حاليکه بهينه بودن اتوماتا يک ويژگي مطلوب در محيطي ايستا بشمار مي‌رود، در عمل ممکن است يک کارايي زيربهينه105 مورد نياز باشد. يک محيط واقعي معمولاً متغير است و در نتيجه عمل بهينه در زمان تغيير مي‌کند. در چنين حالتي و از آنجايي که الگوريتم بر روي هيچ حالت خاصي متوقف نمي‌ماند، يک اتوماتاي نيمه-بهينه مناسب‌تر مي‌باشد. بنابراين تعريف زير را نيز خواهيم داشت:
تعريف3- يک اتوماتاي يادگيرگفته مي‌شود، اگر:
(‏7-5)

تعريف4- يک اتوماتاي يادگير Absolutely Expedient گفته مي‌شود‎[19]، اگر:
(‏7-6)

Expediency بندرت نشان مي‌دهد که اتوماتاي يادگير بهتر از اتوماتاي شانسي محض عمل مي‌کند. بنابراين بهينه بودن106 شاخص مناسب‌تري براي مقايسه روشهاي مختلف يادگيري مي‌باشد. بهينه‌بودن اطمينان مي‌دهد که عملي که توسط اتوماتا انتخاب مي‌شود، عملي بهينه باشد. در محيطهاي واقعي بعلت متغير بودن محيط رفتار زير‌بهينه ارجحيت دارد‎[20].
7-3- آتوماتاي يادگير با عملهاي متغير
اتوماتاي يادگير داراي تعداد عمل ثابتي مي‌باشد اما در بعضي از کاربردها نياز به اتوماتايي با تعداد عمل متغير مي‌باشد‎[26]. اين اتوماتا در لحظه n عمل خود را فقط از يک زير مجموعه غير تهي () از عملها که عملهاي فعال ناميده مي‌شوند، انتخاب مي‌کند. انتخاب مجموعه توسط يک عامل خارجي و بصورت تصادفي انجام مي‌شود. نحوه فعاليت اين اتوماتا بصورت زير است. براي انتخاب يک عمل در زمان، ابتدا مجموع احتمال عملهاي فعال خود () را محاسبه مي‌کند و سپس بردار را مطابق رابطه (7-7) محاسبه مي‌کند. آنگاه اتوماتا يک عمل از مجموعه عمل‌هاي فعال خود را بصورت تصادفي و مطابق بردار احتمال انتخاب کرده و بر محيط اعمال مي‌کند. اگر عمل انتخاب شده باشد، پس از دريافت پاسخ محيط، اتوماتا بردار احتمال عملهاي خود در صورت دريافت پاداش بر اساس رابطه (7-8)و در صورت دريافت جريمه طبق رابطه(7-9) بِروز مي‌کند(در محيط مدلP)‎[26].

(‏7-7)
الف- پاسخ مطلوب از محيط
(‏7-8)

ب- پاسخ نامطلوب از محيط
(‏7-9)

سپس اتوماتا بردار احتمال عملها را با استفاده از بردار و بصورت زير بِروز مي‌کند:

(‏7-10)
7-4- آتوماتاي يادگير تعقيبي
يکي از مشکلات الگوريتم‌هاي يادگيري استاندارد، همگرايي نسبتاً کند آنها در انتخاب عمل بهينه در محيط‌هاي ايستا مي‌باشد که براي رفع آن، تاکنون رهيافتهاي متنوعي ارائه شده است. يکي از اولين رهيافتها، گسسته‌سازي فضاي احتمالات مي‌باشد[118] که در آن احتمالهاي انتخاب عمل، فقط مقادير معيني را در محدوده ]0،1[ مي‌توانند اختيار نمايند. برهمين اساس، تاکنون اغلب الگوريتمهاي استاندارد، گسسته‌سازي نموده‌اند. يکي از مشکلات موجود در اين مدلهاي جديد، همگرايي زودرس107 الگوريتم يادگيري به عمل‌هاي غير بهينه مي‌باشد که ريشه آن در محدود کردن فضاي احتمالات است.
در راستاي تلاش جهت بهبود همگرايي الگوريتمهاي يادگيري، تاتاچار و ساستري‎[118] با معرفي الگوريتمهاي تخمين‌زن108، مسير جديدي را در تحقيقات باز نمودند. مهمترين ويژگي اين الگوريتمها در نگهداري تخميني مداوم109 از احتمال دريافت پاداش هر عمل و استفاده از آن در بروزرساني معادلات اتوماتا مي‌باشد. به عبارت ديگر، در اولين مرحله سيکل عملياتي، اتوماتا يک عمل خود را انتخاب نموده و سپس محيط پاسخي را براي آن توليد مي‌کند. براساس اين پاسخ، الگوريتم تخمين‌زن، تخمين احتمال دريافت پاداش را براي آن عمل بروز مي‌کنند.
الگوريتمهاي تعقيبي دسته‌اي از الگوريتمهاي تخمين‌زن هستند. همانگونه که از اسم آن پيداست، اين الگوريتمها براساس اين حقيقت که بردار احتمال عمل، عملي را که در حال حاضر طبق تخمينها بهترين عمل بنظر مي‌رسد تشويق مي‌کنند، مشخص مي‌گردند. اين کار با افزايش احتمال عملي که تخمين پاداش گرفتن آن در حال حاضر از ساير عملها بيشتر

پایان نامه
Previous Entries دانلود پایان نامه ارشد با موضوع پردازش اطلاعات Next Entries دانلود پایان نامه ارشد با موضوع الگوريتم، يادگير، دريافت