دانلود پایان نامه ارشد درمورد باراک اوباما، منطق فازی، یادگیری ماشین

دانلود پایان نامه ارشد

زبان‏شناسی جای خود را به روش‏های یادگیری ماشین دادند. در یادگیری ماشین، به محاسبات زبان‏شناسی پیچیده و سطح بالای روش‏های زبان‏شناسی نیاز نیست به طوریکه با استفاده از دانش اندکی در زمینه زبان‏شناسی نیز می‏توان به نتایج خوب و قابل توجهی دست یافت.
از سوی دیگر، امروزه اغلب پژوهشگران فرآیند تشخیص مرجع مشترک را به دو مرحله تقسیم می‏‏‏ کنند. (۱) کشف و شناسایی اشاره؛ برای شناسایی عبارت‏های اسمی‏‏‏ که به موجودیت28 ها در دنیای واقعی اشاره دارند، (۲) شناسائی اشاره‏هایی که به یک مرجع واحد اشاره دارند. به این ترتیب در مرحله اول، اکثر عبارت‏های اسمی‏‏‏ تحت عنوان اشاره29 و در قالب چهار گروه اصلی ضمایر30، اسامی‏‏‏ خاص31، اسامی‏‏‏ عام32 و غیر اشاره‏ها33 قرار می‏گیرند،[8،910،16،48،53،72] سپس این فرآیند مشخص می‏‏‏‌کند که هر اشاره به کدام موجودیت در دنیای واقعی اختصاص دار[26]مي‏‏‏توان گفت که فرآیند کشف اشاره، توسعه یافته‏ی فرآیند شناسایی موجودیت‏های نامدار می‏باشد که علاوه بر شناسایی اسامی‏‏‏ خاص، به شناسایی اسامی‏‏‏ عام و ضمایر نیز می‏پردازد. [،23،72،81،113،114]از آنجائیکه بررسی فرآیند‏های شناسایی اشاره و تحلیل مرجع مشترک به طور همزمان خارج از حوزه‏ی این پایان‏نامه است، ما عبارت‏های اسمی‏‏‏ را در قالب انواع اشاره‏های گفته شده در پیکره‏ای تحت عنوان لوتوس برچسب‏گذاری می‏نمائیم و نتيجه‏ي آن را برای تحلیل مرجع مشترک به کار خواهیم برد.
چارچوب کلی این پایان‏نامه به این صورت می‏باشد: در بخش دوم این فصل گذری کوتاه بر انواع روابط ميان دو عبارت اسمی‏‏‏ و به خصوص ارتباط‏های هم‏مرجعی خواهیم داشت. سپس در بخش اول فصل دوم، روش‏های ارائه شده برای تشخیص مرجع مشترک را مورد بررسی و مطالعه قرار می‏دهیم و در بخش دوم آن، به نحوه ایجاد پیکره‏ای مناسب برای کشف اشاره و تحلیل مرجع مشترک خواهیم پرداخت. در فصل سوم، به الگوریتم‏های مناسب برای این پایان‏نامه را معرفی می نمائیم. سيستم پیشهنادی براي شناسايي اشاره‏هاي ارجاع شده در فصل چهارم معرفی خواهد شد و همچنین در این فصل الگوریتم‏های یادشده را مورد ارزیابی قرار می‏دهیم. در نهايت در فصل پنجم نیز به نتيجه گيري و پيشنهاد كارهاي آتي در ادامه‏ي اين پژوهش خواهيم پرداخت.
1-2.بررسی ارتباط هم‏مرجعی
یکی از ‏ویژگی‏های خاص گفتمان این است که می‏توان در یک متن آزادانه در مورد یک یا چند موجودیت صحبت کرد و برای اشاره به هر موجودیت از انواع مختلف عبارت‏ها مانند ضمیر (او)، اسم عام (دانشمند)، اسم خاص (لطفعلی عسگر زاده) و یا یک عبارت اسمی‏(بنیان‏گذار منطق فازی) بهره برد تا به این ترتیب از تکرار عبارت‏ها کاسته و شیوایی مطلب نیز افزایش یابد. همین ویژگی موجب می‏شود که زنجیره‏ها‏ی بالقوه‏ای از تمام عبارت‏های اسمی‏که به یک موجودیت واحد در متن ارجاع دارند، ایجاد گردد. (مانند: او، دانشمند، لطفعلی عسگر زاده، بنیان‏گذار منطق فازی که به شخص پرفسور زاده اشاره دارند).
یکی از اهداف مهم استخراج اطلاعات، شناسایی این زنجیره‏ها در متن است که در فرآیند تحلیل مرجع‏مشترک انجام می‏پذیرد. برای شروع، مثال ۱ را در نظر بگیرید34:
مثال۱: (سیستم آبیاری گلاب) ۱Ant, در روز سه شنبه رونمایی شد. (این سیستم)۱Ana, محصول اندیشه‏ی (دکتر سارا شکری)۲Ant, است. (او) Ana,2، ( یک پژوهشگر)Ana در (شرکت آبیاری لاله)۳ است.
اگر فرض کنیم که پیمانه‏های نشانه‏گذاری تا کشف اشاره به عنوان پیش پردازش‏هایی بر روی متن اجرا شوند، با اجرای این پیمانه‏ها، انواع عبارت‏های اسمی‏موجود در متن (سیستم آبیاری، این سیستم، دکتر سارا شکری، او، یک پژوهشگر و شرکت آبیاری لاله) تعیین و نشانه‏گذاری می‏شوند. سپس با اجرای پیمانه تشخیص مرجع‏مشترک، ارتباطات میان این عبارت‏ها و اطلاعات نهفته در مورد موجودیت‏های شرکت کننده در متن آشکار می‏شود. به عنوان نمونه، می‏دانیم «او» و «سارا شکری» (با اندیسِ۲) به یک فرد مشخص و همچنین «سیستم آبیاری گلاب» و «این سیستم» (با اندیسِ۱) نیز به یک سیستم مشخص اشاره می‏کنند.
استفاده از اصطلاح موجودیت در تحلیل مرجع‏مشترک، این سؤال را مطرح می‏کند که چه چیزهایی موجودیت محسوب می‏شوند؟ تاکنون گروه‏بندی‏های متعددی برای انواع موجودیت‏ها ارائه شده است، به عنوان نمونه35ACE، یک تقسيم بندي هفت موجودیتی برای انواع موجودیت‏ها (شخص، سازمان، مکان، سیاسی، تسهیلات، سلاح و خودرو) و تعداد زیادی زیرگروه (به عنوان مثال شخص: فرد، گروه) و کلاس برای هر موجودیت پیشنهاد کرده است و[۶۴] که اغلب پژوهشگران همه این موجودیت‏ها و یا گاهي اوقات برخی از آن‏ها را مورد مطالعه و بررسی قرار می‏دهند.
یکی از ‏ویژگی‏های تحلیل مرجع‏مشترک این است که علاوه بر انواع موجودیت‏های رایج، مي‏توانیم در حوزه‏ها‏ی متفاوت از تعاریف پیش فرض خود نیز برای موجودیت‏ها نیز استفاده نماییم. همین ویژگی موجب شده است تا برخی از پژوهشگران مانند[97] به تحلیل مرجع‏مشترک در متون پزشکی پرداخته و بررسی موجودیت‏هایی مانند انواع دارو، بیماری، ژن وغیره را هدف پژوهش خود قرار دهند.
با توجه به آنچه تا‏کنون گفته شد، انتظار می‏رود که با بررسی مراجع مشترک در مثال ۱، عبارت «یک پژوهشگر» نیز به همراه «او» و «سارا شکری» در یک زنجیره واحد قرار گیرد، اما خروجی پیمانه تحلیل مرجع‏مشترک چنین نیست. هر چند از نظر ما این ارتباط کاملاً بدیهی است اما واقعیت این است که عبارت «یک پژوهشگر» به عنوان ارجاع به موجودیت شخص (در مثال ۱: سارا شکری) که در دنیای واقعی زندگی می‏کند در نظر گرفته نمی‏شود، چون منظور از «یک پژوهشگر» می‏تواند هر شخص دیگری نیز باشد. در این حالت فرآیند دیگری تحت عنوان تحلیل پیشایند مي‏تواند ارتباط میان «یک پژوهشگر» و «سارا شکری» را تشخیص دهد.
همان طور که مشاهده شد، تحلیل مرجع‏مشترک و تحلیل پیشایند دو مفهوم نزدیک به هم می‏باشند به طوری که عموماً به موازات تحلیل مرجع‏مشترک، با تحلیل پیشایند روبرو می‏شویم و حتی برخی به اشتباه این دو عبارت را معادل یکدیگر می‏پندارند. با وجود اینکه این دو پیمانه از بسیاری از جهات با یکدیگر مشابه هستند، اما از جهاتی نیز با یکدیگر تفاوت دارند، و عدم توجه به این مسئله موجب سردرگمی‏و ایجاد ابهام در تحلیل متن می‏گردد.در این بخش، هدف ما بررسی هرکدام از این فرآیند‏ها‏ و مطالعه برخی از شباهت‏ها‏ و تفاوت‏ها‏ی میان این دو فرآیند می‏باشد.
1-۲-۱.هم‏مرجع در مقابل پيشايند
برای اینکه بخواهیم یک سیستم تحلیل مرجع‏مشترک و یا یک سیستم تحلیل پیشایند را انتخاب کنیم لازم است ابتدا دو پدیده زبان‏شناسی پیشایند36 و هم‏مرجع37 را به خوبی بشناسیم. شباهت‏ها و تفاوت‏های میان آن‏ها را درک کنیم. همان طور که پیش‏تر نیز اشاره شد، اغلب دو عبارت پیشایند و هم‏مرجع را به عنوان دو عبارت نزدیک یا گاهاً مترادف می‏شناسند به طوری که در بسیاری از پژوهش‏ها این دو اصطلاح را به جای هم استفاده می‏کنند[59،85،90]
نخستین بار ارتباط میان عبارت‏های اسمی‏توسط کلرک38 در سال ۱۹۷۵ مطرح شد که آن‏را تحت عنوان پل‏زنی پیشایند مطرح می‏کرد. [43] پس از آن هیرست39 در سال ۱۹۸۱، عبارت پیشایند را بیشتر به منظور تفسیر مخفف‏ها در متن به کار برد. هیرست معتقد بود پیشایند یک ابزار ساخت، در گفتمان است که با استفاده از آن یک مخفف به یک یا چند عبارت غیر مخفف که پیش از آن در متن آمده‏اند، اشاره می‏کند تا به این ترتیب با استفاده از عبارت‏های پیشین، عبارت مخفف تفسیر شود. مفهوم پیشایند با یک جفت عبارت همراه است که عموماً عبارت ارجاع‏دهنده را با عنوان «تالی40» و عبارت مفسر را با عنوان «مقدم41» یا «مرجع» می‏شناسیم. هیرست این دو عبارت ارجاع دهنده و مرجع را با هم «هم‏ارجاع42 » و فرآیند شناسایی یک مقدم برای یک تالی، را «تحلیل43» می‏نامد.[ 34]
در سال 1998 نيز هیرسکمن44 و چینکور45 اصطلاح هم‏مرجع را کنفرانس تشخیص پیام46 یا به اختصار MUC استفاده کردند[24،59] آنها و بسیاری از پژوهشگران دیگر، زمانی دو عبارت را با یکدیگر هم‏مرجع در نظر می‏گیرند که هر دو عبارت دقیقاً به یک موجودیت در دنیای واقعی اشاره داشته باشند. البته این پژوهشگران تفاوتی میان دو رابطه‏ی هم‏مرجعی و پیشایندی در نظر نگرفته بودند، تا اینکه این مسئله با انتقاد ون47 و کیبل48 مواجه شد به طوری که آن‏ها این دو اصطلاح را از دیدگاهی دیگر مورد بررسی قرار دادند و برخي از نقاط مشترك و تفاوت هاي آنها را مطرح نمودند.[۵۸]
1-۲-۱-۱.ارتباط هم‏مرجع:
ارتباط میان دو عبارت اسمی‏مانند ۱a و ۲a زمانی به عنوان ارتباط هم‏مرجع در نظر گرفته می‏شود که هر دو عبارت اسمی‏ به عنوان ارجاع‏هایی مشخص، یک موجودیت فرا زبان‏شناسی واحد را تفسیر نمایند. به واسطه‏ی این تعریف نیاز است تا به طور جداگانه مرجع هرکدام از عبارت اسمی‏Reference(ai) شناسایی شود. در نهایت یک ارتباط هم‏مرجعی به صورت ذیل خواهد بود :
(۱) عبارات اسمی‏۱a و ۲a با یکدیگر هم‏مرجع هستند اگر و تنها اگر Reference(a1)= Reference(a2) باشد.
مثال ۲: (باراک اوباما)۱Ant,، به سوریه سفر کرد. (او) ۱Ana, گفت…

جدول 1-۱: مقایسه ویژگی‏ها‏ی دو ارتباط هم‏مرجع و پیشایند
هم‏مرجعی
پیشایندی
۱) یک رابطه هم‏مرجعی یک رابطه‏ی هم ارزی است به عنوان نمونه «او» و «باراک اوباما» هر دو به یک موجودیت اشاره دارند.
۱)یک رابطه‏ی پیشایندی، متقارن نیست. به این معنا که اگر ۱a به عنوان مقدم برای 2a در نظر گرفته شود عبارت اسمی‏۲ a نمی‏تواند متقابلاً نقش مقدم را برای عبارت اسمی‏۱a ایفا نماید.

۲)رابطه هم‏مرجعی یک رابطه‏ی متقارن است، به این معنا که اگر «او» با «باراک اوباما» هم‏مرجع است «اوباما» نیز با «او» هم‏مرجع می‏باشد.

۳)ارتباط میان عبارت‏های اسمی‏هم‏مرجع، متعدی است به این معنا که اگر «او» با «باراک اوباما» هم‏مرجع است و «او» نیز با «رئیس جمهور آمریکا» هم‏مرجع باشد بنابراین حتماً «باراک اوباما» نیز با «رئیس جمهور آمریکا» هم‏مرجع می‏باشد.
۲)رابطه‏ی پیشایندی یک جفت از عبارت‏های اسمی‏را در نظر می‏گیرد به طوری که در این رابطه‏یک عبارت نقش مفسر و دیگری نقش ارجاع دهنده را دارند. بنابراین به طور ذاتی این رابطه غیرمتعدی می‏باشد.
۴) یک ارتباط هم‏مرجعی یک ارتباط فرا متنی است به این معنا که تفسیر هیچ کدام از عبارت‏های اسمی‏هم‏مرجع به محتوای متن وابسته نمی‏باشد. به عبارت دیگر، دو عبارت هم‏مرجع لزوماً برای تفسیر به یکدیگر وابسته نیستند.
۳)این رابطه به محتوای متن حساس است به این دلیل که تالی یا عبارت ارجاع‏دهنده برای اینکه مفهوم باشد نیاز به مفسر یا تفسیر دارد.
۵)یک رابطه‏ی هم‏مرجعی خالص می‏تواند در تحلیل مرجع‏مشترک در متون متقاطع به کار رود.
۴)معمولاً تالی یا عبارت ارجاع‏دهنده در یک رابطه‏ی پیشایندی، به دیگر اجزای تشکیل‏دهنده در همان جمله و یا نزدیک‏ترین اظهارات ممکن در گفتمان اشاره دارد.
۶) برخی از عبارت‏های اسمی‏ذاتاً با یکدیگر هم‏مرجع هستند به عنوان مثال «پرفسور زاده» و «بنیان گذار منطق فازی»، این دو عبارت هر کجا که باشند به یک موجودیت به نام «پرفسور زاده» اشاره خواند داشت. به عبارت دیگر چنین ارتباطی یک ارتباط هم‏مرجعی خالص نامیده می‏شود
۵) یک تالی تنها نیاز به یک مفسر دارد تا آن‏را تفسیر نماید بنابراین اگر چندین مفسر برای آن در متن وجود داشته باشد مناسب‏ترین و نزدیک‏ترین آن‏ها انتخاب خواهد شد.
۷)بیشتر برای استخراج اطلاعات در خصوص یک یا چند موجودیت در متن به کار می‏رود.
۶) به درک بهتر متن و رفع ابهام برخی از واژگان در متن کمک می‏کند.
1-۲-۱-۲.ارتباط پيشايندی:
یک ارتباط پیشایندی49، از یک جفت عبارت اسمی‏(۱aو۲a) تشکیل می‏شود به طوری که عبارت اول نقش مفسر را برای عبارت دوم ایفا نماید. بنابراین یک ارتباط پیشایندی به صورت ذیل تعریف می‏شود:
(2)عبارت اسمی‏اول(۱a) به عنوان مقدم برای عبارت اسمی‏دوم (۲a) در نظر گرفته می‏شود اگر و تنها اگر ۲a برای تفسیرش به ۱a وابسته باشد
مثال ۳: هنگامی‏که پسر وارد (اتاق)Ant شد، (درب)Ana ب

پایان نامه
Previous Entries دانلود پایان نامه ارشد درمورد یادگیری ماشین، بهبود عملکرد، سلسله مراتبی Next Entries دانلود پایان نامه ارشد درمورد فرآیند تحلیل، منطق فازی، علی کریمی