
یکدیگر هممرجع هستند یا خیر. حتی در برخی موارد میزان احتمالِ هممرجع بودن آنها نیز تعیین میگردد. در آخر نیز مجموع این تصمیمات دوبهدو به مسئلهی افراز اشارهها تبدیل میگردد. که میتواند با استفاده از خوشهبندی و یا هر روش افراز دیگر انجام گیرد. یکی از محاسن این دسته از روشها در سادگی آنها میباشد. علاوه براین، مدلهای بسیاری برای حل مسائل ردهبندی وجود دارند که از کارائی بالایی برخوردار میباشند. از سوي دیگر، مشکل این دسته از روشها در این است که تصمیمگیری در مورد جفت عبارات اسمی، به صورت مستقل انجام میگیرد و روابط متعددی در تصمیمگیری در نظر گرفته نمیشود. به عبارت دیگر مشکلی به نام «ناسازگاریهای سهگانه81» بوجود خواهند آمد. بهعنوان مثال، در روشهای ردهبندی، اگر عبارتهای “Mrs. Kazemi” و “Kazemi” هممرجع باشند احتمال اینکه عبارتهای “Kazemi “و “he” نیز با هم، هممرجع باشند وجود دارد [6]. از آنجائیکه این دو تصمیم به طور جداگانه گرفته میشود؛ امكان بروز این خطا که در جفت اول، جنس از نوع مونث، اما در عبارت دوم، جنس از نوع مذکر است و هر سه نمیتوانند به یک مرجع مشترک اشاره داشته باشند، غير قابل اجتناب است.[63،76]
برطرف کردن چنین مشکلی به مسئله خوشهبندی برمیگردد. البته شايان ذكر است كه بر طرف كردن چنين خطايي در زبان پارسي، حتي با استفاده از خوشهبندي نيز آسان نخواهد بود، چرا كه جنسيت در زبان پارسي مشخص نيست، در هر حال، با توجه به این مسئله، روال کار در مدلهای مبتنی بر جفت اشاره در دو مرحله انجام خواهد شد. اما پیش از آنکه بخواهیم هر کدام از این دو مرحله (رده بندی و افراز) را شرح دهیم، به طور خلاصه به روال تولید نمونههای آموزشی مثبت و منفی از متن ورودی میپردازیم.
جدول2-۲: برخی از ویژگیهای ارائه شده در تحلیل مرجع مشترک[12،44،45،50،65،77،82،103،105]
ویژگی
توضیح
فاصله
این ویژگیها، فاصله میان دو عبارت اسمی(mi , mj) را در قالب تعداد جملات بین دو عبارت، تعیین ميكنند.
تطبیق
این ویژگیها، تطبیق عدد و جنس دو عبارت اسمی(mi , mj) را مشخص مینمايند.
نوع عبارت اسمی
این ویژگیها، نوع عبارات اسمی را بررسی میپردازند که میتواند هم از طریق تحلیل نحوی و هم از طریق رویکردهای سطحی مشخص شود. عموما انواع عبارات اسمی به سه دسته اسم عام، اسم خاص، ضمایر تقسیم میشوند.82
*شناسایی نوع عبارتهای اسمی در زبان انگلیسی ساده تر از زبان پارسی است. به عنوان نمونه اسامی خاص در زبان انگلیسی با حرف بزرگ شروع میشوند در صورتی که در زبان پارسی چنین نیست.
نحوی سطحی
در این حالت برخی از ویژگیهای نحوی مورد بررسی قرار میگیرند؛ به عنوان نمونهایا mj به عنوان بدل یا عطف بیان برای mi محسوب میشود.
نحوی عمقی
برخی از پژوهشگران، از تجزیهگر برای اینکار استفاده مینمایند. آنها از درختهای تجزیه و یا زیر درختهای تجزیه به عنوان ویژگیهای نحوی عمقی بهره میبرند.به عنوان نمونه [45] خلاصههای مفیدی مانند مسیر وابستگی میان گرههای ریشه و هر کدام از mi و mj را محاسبه مینمایند. همچنین میتوان از برخی از محدودیتهای اتصال مانند آنچه در بخش مشابهت نحوی روشهای زبانشناسی گفته شد نیز استفاده نمود.
تطابق رشته ای
این ویژگی میتواند برای عبارتهای اسمی کامل و اسامی بسیار مفید باشد. اینکه این تطبیق چه به صورت کامل درنظر گرفته شود چه به صورت جزئی، میتواند مانند [103] از ورژن قویتری مانند «تطابق هسته» پیروی کند. به این ترتیب که در این رویکرد تمامی وابستهها حذف شده و تنها به تطابق رشتهای هستهها در mi و mj پرداخته میشود. البته در گاهی اوقات مانند اسامی انسانهایی که در وابسته ی پیشین خود با یکدیگر متفاوت هستند(آقای اسمیت و جانت اسمیت) و یا نامهای برخی از سازمانها میتوان از «تطابق اسم مستعار83» نیز استفاده کرد.یکی از تکنیکهای ماهرانه در این خصوص، روش [65] میباشد که استفاده از تکنیک فاصله ویرایش حداقل84 را ارائه نموده است.
تطابق اسم مستعار
این ویژگیها، به بررسی میکند آیا یکی از دو عبارت اسمی mi ، نام مستعار mj هست یا خیر.
تطابق کلاس معنایی
این ویژگیها، تطبیق کلاس معنایی هستههای دو عبارت اسمی (mi , mj) را بررسی مینماید در برخی موارد این تطابق بر اساس سلسله مراتب شبکه واژگان85 بررسی میشود. گاهی اوقات تحلیل مرجع مشترک نیاز به بررسی دایره المعارف دارد(مانند Wikipedia) تا از این طریق بتواند به استدلال ارتباط بین عبارتهای مختلف بپردازد.
روال کار تولید نمونههای آموزشی
فرض کنید زنجیره اشارههای M را داریم { m1-m2-m3-m4}=M به طوری که اعضای این زنجیره از یک متن آموزشی نشانهگذاری شده، استخراج شده باشد و همه به یک مرجع واحد اشاره داشته باشند:
برای تولید نمونههای آموزشی مثبت، هر اشاره در یک زنجیره را با اشارهی مجاورش در همان زنجیره، بهعنوان یک نمونه آموزشی مثبت در نظر میگیریم. بهعنوان مثال m2-m3 را در نظر میگیریم. از طرفی دیگر، برای تعیین نمونههای منفی فرض میکنیم که عبارات زیر به ترتیب از متن آموزشی استخراج شدهاند. …- m1-b1-c3-a-m2 که در آن b1 وc3 به زنجیرههای اسمی دیگری تعلق دارند و a نیز جزئی از هیچ زنجیره اسمی (هممرجع) نمیباشد. بنابراین جفتهای b1-m2 ، c3-m2 ، a-m2 و… نمونههای منفی را تشکیل میدهند.[13] شکل 2-۱ یک مثال از روال تولید نمونههای آموزشی مثبت و منفی توسط درخت تصمیم را نمایش میدهد.
شکل 2-۱ .نمونهای از نمونههای مثبت و منفی که توسط C4.5 تولید شده است[31]
2-1-۳-۲-۱.ردهبندی جفت عبارتهای اسمی:
الگوریتمهای ردهبندی86 مانند سایر روشهای با ناظر87، به استفاده از یک پایگاه داده نیاز دارند که در آن زنجیرهای از اشارههایی که به یک موجودیت واحد ارجاع میپردازند، نشانهگذاری شده باشد. هرچند که میتوان هر یک از الگوریتمهای ردهبندی را به منظور تشخیص مرجع مشترک به کار برد، اما همان طور که گفته شد، پیش از استفاده از آنها باید متن ورودی توسط چند پیمانه مورد پردازش قرار بگیرد، تا تمامی اشارههای موجود در آن شناسایی شوند. سپس به ازای هر اشاره (mi)، مجموعهای از اشارههای هممرجع کاندیدا میشوند. در ادامه با جفت کردن اشاره با تمام کاندیداهای موجود در زنجیره، جفت اشارهها تعیین میگردد.
پس از تولید آنها، به ازای هر جفت، یک بردار ویژگی تشکیل شده و در قالب نمونههای آموزشی به الگوریتم یادگیری داده میشود. سپس الگوریتم براساس بردار ویژگی داده شده آموزش میبیند که آیا جفت اشارههای مورد بررسی به یک موجودیت مشترک ارجاع دارند یا خیر، و یا اینکه احتمال هممرجع بودن آنها چقدراست. به این ترتیب میتوان یک ردهبند مناسب ایجاد نمود. عموماً برای انجام این کار از انواع متفاوت ویژگیها مانند آنچه در جدول 2-2 گفته شد، استفاده میشود، که با توجه به تعداد ویژگیهای به کار رفته، اندازه های متفاوتی برای بردارهای ویژگی رقم زده میشود. از پژوهشهای انجام شده میتوان به کاردیه88 با 53 ویژگی، مک کارتی89 با ۸ ویژگی ، گریست90 با ۱۳ ویژگی واستویانو91 با بیش از ۸۰ ویژگی اشاره نمود. در ادامه به بررسی ردهبندي درخت تصميم میپردازیم. [52،57،101]
2-1-3-2-1-1.درخت تصميم
برای نخستین بار در سال ۱۹۹۵، مک کارتی از روش درخت تصمیم برای تشخیص مرجع مشترک استفاده نمود[52]،اما در سال ۲۰۰۱ بود که سون92 و همکارانش توانستند استفاده از آن را بهعنوان یک روش مطرح و موفق، ارائه نمایند[105]. به دنبال آنها، [12،39،40،75،99،101،108]، نیز از درخت تصمیم استفاده کردهاند. در سال ۲۰۱۰،کوبدانی و همکارش یک سیستم پیمانههاي برای تشخیص مرجع مشترک ارائه دادند، آنها با بررسی نتایج ردهبندهای مختلفی مانند درخت تصمیم، نیو بیز، ماشین بردار پشتیبان و حداکثر آنتروپی برای زبانهای آلمانی و انگلیسی، ردهبند درخت تصمیم را برگزیدند[39]. یک سال بعد نیز آنها، سیستم پیشنهادی خود را تحت عنوان سیستم خودراه انداز تحلیل مرجع مشترک، توسعه دادند و از ویژگیهایی مانند شبکه واژگان استفاده کردند تا به طور خودکار، باهمآیی واژگان نشانهگذاري شود.[40]در سال ۲۰۱۲، بانسال و کلین نیز ویژگیهای تحت وب را گسترش داده و برای انجام ردهبندی به کار بستند. میتوانید اطلاعات بیشتر را در [12]مطالعه نمائید.
همانطورکه در بخش قبل گفته شده، آموزش ردهبند درخت تصمیم با استفاده از متون آموزشی انجام میشود. پس از آموزش ، نوبت به مرحله آزمایش آن بر روی متون آزمایشی میرسد. طبق پژوهشهای ارائه شده، فرآیند ردهبندی جفت اشارهها میتواند به صورتهای ذیل صورت پذیرد:
نخست، پیش از فرآیند تصمیمگیری، لازم است تا در یک یا چند پیمانه پیش پردازشی، تمامی اشارههای موجود در متن آزمایشی استخراج شوند. سپس برای هر یک از اشارهها که بهعنوان تالی انتخاب میشود، تمامی اشارههای ما قبل آن بررسی شده تا بهعنوان کاندیداهایی، برای عبارت مقدم یا عبارت اسمی هممرجع در نظر گرفته شوند. (این عمل از راست به چپ انجام خواهد شد) در ادامه به ازای هر جفت اشاره، یک بردار ویژگیها تولید میشود و این بردار بهعنوان ورودی به ردهبند داده خواهد شد. این فرآیند، برای هر اشاره به طور مداوم انجام میشود تا زمانی که ردهبند اعلام نماید که دو اشاره با هم، هممرجع هستند و یا اینکه دیگر اشارهای قبل از تالی وجود نداشته باشد. به این ترتیب، تمامی زنجیرههای اسمی متن آزمایشی یافت خواهند شد.[105]
کاردیه و همکارانش در پژوهشی دیگر، گسترش دیگری بر روش [105]ارائه کردند که در آن به ازای هر عبارت اسمی، بررسی میشود که آیا آن عبارت اسمی، دارای مرجع هست یا خیر و آنها برای تعیین این مسئله از مدل حداکثر آنتروپی93 استفاده کردند.
یانگ94 و همکارانش، گونهای از یادگیری رقابتی95 را در زمینه تشخیص مرجع مشترک، به کار گرفتند. در روش ارائه شده توسط آنها، نمونههای آموزشی به این ترتیب فراهم میشوند که به ازای هرتالی، یک جفت مقدم کاندیدا در نظر گرفته میشود؛ بطوریکه یکی از آنها مرجع تالی باشد ولی دیگری با تالی در یک زنجیره با مرجع مشترک قرار نداشته باشد. اینگونه نمونههای آموزشی، باعث میشوند که عامل یادگیرنده، تفاوت میان کاندیداهای هممرجع و غیرهممرجع را آموزش ببیند و برای مقایسه میان کاندیداهای مختلف، توانمندتر عمل نماید.[109]
2-1-۳-۲-۲. افراز:
در اکثر روشهایی که اخیراً ارائه شده، مرحله ردهبندی یکسان بوده است که با کمک یکی از روشهای درخت تصمیم، [52،101،105] حداکثر آنتروپی[96]، مدل احتمالی تولیدی [73]و یا ماشین بردار پشتیبان[28،35،57،91] پیاده سازی شده است96. روش ارائه شده توسط[105]، بیش از سایر ردهبندهای ارائه شده، مورد توجه و استفاده پژوهشگران قرار گرفته است. اما آنچه پژوهشهای ارائه شده را از یکدیگر متمایز میسازد، ویژگیهای استفاده شده و روش افراز جفت اشارهها است. به عنوان مثال، کاردیه و همکارانش، چند راهکار برای افراز و بهبود کارائی روش [105] ارائه دادند:
1) استراتژی بهترین- اولین97:
در این روش مانند روش قبل تمامی اشارههای ماقبل تالی بهعنوان کاندیدایی برای مرجع مشترک انتخاب میشوند. در نهایت اشارهای انتخاب میشود که بالاترین احتمال را برای هممرجع بودن، با عبارت مورد بررسی داشته باشد.[101]
2)تولید مجموعه آموزشی :
برای قابل اجرا بودن ردهبندی بهترین – اولین نحوهی انتخاب نمونههای آموزشی تغییر میکند. عملکرد تولید مجموعه آموزشی به این ترتیب است که به جای اینکه نمونههای مثبت را از هر عبارت اسمی و نزدیکترین عبارت اسمی هممرجع با آن فراهم شود، نمونههای مثبت از هر عبارت اسمی و مناسبترین عبارت اسمی که میتواند با آن هممرجع باشد، انتخاب میگردد.[101]
2-1-۳-۲-۲-۱. درخت بل98
در سال ۲۰۰۴، لو99 و همکارانش، روشی برای تشخیص مرجع مشترک ارائه دادند که در آن از درختِ بل بهعنوان فضای جستجو استفاده شده است.[106] سال بعد
