
از آن نیز عماد زیتونی و همکارانش از این روش برای زبان عربی استفاده نمودند.[49] به طور کلی در این روش درختِ بل، مسئله تشخیص مرجع مشترک بهعنوان یافتن بهترین مسیر از ریشه درختِ بل به گرههای انتهایی است. در این روش از مدل حداکثر آنتروپی جهت رتبهبندی این مسیرها استفاده میشود. هر یک از برگهای درختِ بل، نمایانگر یکی از خروجیهای ممکن برای تشخیص زنجیرهی عبارت اسمی هممرجع میباشد.گرهی ریشه، وضعیت آغازین فرآیند و تنها شامل یک موجودیت است که اولین عبارت اسمی به آن تعلق دارد. هنگام اضافه کردن دومین عبارت اسمی، میتوان از هر یک از عملیاتهای «اضافه کردن به یک موجودیت قبلی» و یا «آغاز کردن یک موجودیت جدید» استفاده نمود.
پس از انجام هر یک از عملیاتها، لایه دوم گره ایجاد میشود. بهعنوان مثال سه عبارت اسمی را در یک متن در نظر بگیرید. درختِ بل متناظر با فرآیند تشخیص مرجع مشترک بر روی متن شامل سه عبارت مذکور مطابق شکل 2-۲ خواهد بود.
شکل 2-۲. درختِ بل به ازای سه عبارت اسمی100
همانطور که در شکل2-2 مشاهده مینمایید، این فرآیند یک فرآیند همزمان با عبارات اسمی است، بدین معنی که هر لایه از گرهها تنها با اضافه کردن یک عبارت اسمی جدید ایجاد میشود. از آنجائیکه تعداد برگهای درخت برابر است با تعداد خروجیهای ممکن فرآیند تشخیص مرجع مشترک، و این عدد با عدد بل یکسان است، درخت تشکیل شده را درختِ بل مینامند. عدد بل تعداد راههایی است که میتوان n شیء متمایز را به زیر مجموعههایی که با هم اشتراکی ندارند، افراز نمود.
در سال ۲۰۰۷، لو، یک مدل دوگانه101 برای بهبود روش درختِ بل ارائه داد. در روش درختِ بل تنها یک مدل با استفاده از حداکثرآنتروپی آموزش داده میشد و آن مدل «متصل کردن به یک موجودیت قبلی» بود. همچنین احتمال «آغاز کردن یک موجودیت جدید» نیز از روی احتمال متصل نشدن به موجودیتهای قبلی محاسبه میشد. شیوه ارائه شده توسط لو مشابه شیوه درختِ بل است، با این تفاوت که دو مدل جداگانه برای «متصل کردن به یک موجودیت قبلی» و «آغاز کردن یک موجودیت جدید» در نظر گرفته میشود. هر کدام از این مدلها بصورت مجزا آموزش داده میشوند. نتایج نشان دادهاست که این شیوه بهتر از شیوهی درختِ بل عمل میکند.[107]
مزایا و معایب روش درختِ بل
مزیت این روش، در نظر گرفتن و رعايت روابط متعدی، است. مشکل این روش در آن است که عدد بل با افزایش n (تعداد عبارات اسمی متمایز) به سرعت افزایش مییابد و بدین ترتیب با افزایش تعداد عبارتهای اسمی، جستجو در درختِ بل مشکلتر میشود. جهت رفع این مشکل از یک مکانیزم جستجوی کارا و روشهای هرس کردن درخت استفاده میشود.
2-1-۳-۲-۲-۲.افراز گراف102
در روش افراز گراف، پس از ردهبندی و تصمیمگیری که در مورد هممرجع بودن دو عبارت اسمی صورت میگیرد. نوبت به مرحله تعیین زنجیرههای عبارتهای اسمیِ هممرجع که در یک گروه قرار داشته و به یک موجودیت اشاره میپردازند، ميرسد.
در افراز گراف، گرههای گراف، عبارتهای اسمی(یا اشارهها) و وزن یالهای میان هردو گره، بیانگر ارتباط یا به عبارت دیگر میزان احتمال هممرجع بودن آن دو گره میباشد. این وزنها از مرحله ردهبندی بدست میآیند. برای تشخیص موجودیتهای موجود در متن که با هم هممرجع هستند، باید گراف را به گونهای افراز کرد که تمام گرههای قرار گرفته در یک زیرگراف به یک موجودیت یکسان اشاره داشته باشند[18،20،30،51]
در مرحله تعیین زنجیره عبارات هممرجع، نیکلای103 و همکارانش در سال ۲۰۰۶، از روشی استفاده نمودند که در آن فضای عبارات اسمی هممرجع، به صورت یک گراف بدون جهت وزندار نمایش داده میشود. [18]در این روش از ردهبند حداکثر آنتروپی برای وزندهی یالها استفاده شده (آنها بر این باورند که مدل حداکثر آنتروپی میتواند نتایج بهتری نسبت به مدل درخت تصمیم ارائه دهد) و به ازای هر یک از انواع موجودیتها گراف جداگانهای ایجاد میشود. در نهایت، نمونه تغییر یافتهای از الگوریتم «برش کمینه104 ی» استور105 [64]بر روی هر کدام از گرافها اعمال میشود و بدین ترتیب مرحله خوشهبندی به انجام پیمانههاي که افرازهای ایجاد شده توسط این الگوریتم، عبارتهای اسمی خواهند بود که به یک موجودیت واحد اشاره میپردازند. همچنین میتوان مانند بانسال106 ، از الگوریتم خوشهبندی رابطهای نیز برای تخمین مسئلهی افراز گراف استفاده نمود.[72] در این شیوه، ناسازگاری حضور یک گره در هر افراز محاسبه میشود و مرحله افرازبندی بگونهای انجام میپذیرد که این ناسازگاریها به حداقل ممکن برسند.
در سال ۲۰۱۰، ساپنا107 و همکارانش یک روش افراز گراف محدود شده را پیشنهاد نمودند. آنها برای وزندهی به یالها از ردهبند درخت تصمیم استفاده کردند و برای بهینه سازی نتایج از یک الگوریتم تکرارشونده تحت عنوان برچسبگذاری راحت108 استفاده نمودند.[47] در این الگوریتم، برای تخصیص هر گره به هر افراز، محدودیتهایی بررسی میشود. و هدف آن پیدا کردن یک برچسبگذاری وزنی بیشینه است.[30]
از طرف دیگر، کای و همکارانش یک مدل افراز ابرگراف عمومی را پیشنهاد دادند. هدف نهائی این مدل انجام تحلیل مرجع مشترک در یک مرحله است. نخست کل متن به عنوان یک ابرگراف109 در نظر گرفته میشود. سپس این ابرگراف با در نظر گرفتن ویژگیهایی مانند تطابق رشتهای، تطبیق ضمیر و… به تعدادی زیرگراف تقسیم میشود. برای افراز گراف نیز، خوشهبندی طیفی بازگشتی در میان تمام زیر گرافها اجرا شده و به جای استفاده از برش کمینه، از برش نرمال110 استفاده میشود، این کار آنقدر ادامه پیدا میکند تا به شرط توقف برسد.[20]
مزایا و معایب روش افراز گراف
روش افراز گراف نسبت به برخی از روشها مانند روش درختِ بل[106]عملکرد بهتری نشان داده است. البته روش افراز گراف نیز مانند روش درختِ بل، روابط متعدی را در نظر میگیرد، و در عین حال از برخی خصوصیتهای الگوریتمهای گراف مانند سادگی و موثر بودن بهره میبرد. از طرفی دیگر، این روش هنگام تشکیل و افراز گرافها، تنها از افراز غیراشاره استفاده میکند و برای تشخیص مرجع مشترک، از یک شیوهی ردهبندی ساده بهره میگیرد. در نتیجه عملکرد آن در تشخیص مرجع مشترک خيلي مناسب نیست.
2-1-۳-۳.روشهای مبتنی بر پيکره
تکنیکهای داده کاوی111، از جمله روشهایی هستند که در مسئلهی تشخیص مرجع مشترک استفاده شدهاند. هاراباگیو112 و همکارانش در سال ۲۰۰۱ ، از پایگاه دادههای برچسبگذاری شدهی MUC-6 و MUC-7 استفاده کردند. آنها به منظور استفاده از شیوههای دادهکاوی با استفاده از این دو پایگاه داده، دادههای بیشتری تولید کردند.[93]
یکی از نتایج بدست آمدهی قابل توجه آنها این است که تعداد پیوندهایی که یک عبارت اسمی را به یک عبارت اسمی خاص متصل کردهاست ۲۹٫۱ % و تعداد پیوندهای هممرجع میان دو عبارت اسمی عام ۱۰% است. از طرفی دیگر حدود۸۳% از زنجیرههای هممرجع در پیکرهی MUC-6 با ویژگیها و قواعد سادهای مانند تکرار یک عبارت اسمی، نام مستعار، هسته113 مشترک و غیره حل خواهد شد.
پس از تولید پایگاهداده بزرگتر با استفاده از پایگاه دادههای برچسبگذاری شده موجود، تعدادی قاعده استخراج میشود و به ازای هر قاعده، آنتروپی آن بهعنوان معیاری برای درجه صحت آن قاعده در نظر گرفته میشود. سپس افراز عبارتهای اسمی به گونهای انجام میپذیرد که تعداد بیشتری از قاعدههایی که درجه صحت بالاتری دارند، این افراز را تایید نمایند.
میتوان از پیکرهها برای کاوش در الگوهایی مانند الگوهایی که بوسیله آنها دو عبارت اسمی به یکدیگر مرتبط میشوند، بهرهگرفت. الگوهایی که به کرات میان دو عبارت اسمی مشاهده شدهاند، بیانگر رابطهی میان آن دو عبارت اسمی هستند.
بین114 و همکارانش در سال ۲۰۰۴، سیستمی ایجاد کردند که در آن سیستم براساس رابطه میان کلمات و زمینهای را که آن کلمات میتوانند در آن باشند را به شیوهای بدون نظارت آموزش میبینند. مشخص کردن نقش معنایی عبارتهای اسمی، نقش بسیار مهمی در زنجیرههای عبارات اسمی هممرجع دارد. [25] بهعنوان نمونه مثالهای ذیل را در نظر بگیرید.
Maria, Roberto, and Dino, who were staying at the Tecun hotel مثال7: kid-napped by armed men …
ماریا، ربرتو و داینو که در هتل«تکان»مستقر بودند، توسط مردان نقابدار دزدیده شدند.
After they were released …مثال8:
پس از آنکه آنها آزاد شدند…
After they blindfolded the men…مثال9:
پس از آنکه مردها دستگیر شدند…
درمورد (مثال8)، « آنها» با «ماریا»، «ربرتو» و «داینو» (پسران) هممرجع هستند.و در مورد (مثال9)، «آنها» با «مردان نقابدار» مرجع مشترک دارند.
در چنین شرایطی، یافتن عبارات اسمی که به یک مرجع واحد اشاره دارند، نیاز به یک دانش قبلی دارد. به عنوان مثال کسانی که به اسارت گرفته میشوند، آزاد میشوند. کسب و استفاده از چنین دانشی در زبانهای طبیعی، یک مسئله حل نشدهاست. در عین حال وجود پیکرههای بزرگ میتواند برای آسانتر شدن کاوش در چنین الگوهایی کمک بسزائی داشته باشد. بین و همکارانش نیز از شیوه بدون نظارت مبتنی بر پیکره برای این منظور استفاده نمودهاند. در شیوهی ارائه شده توسط آنها، مفاهیم به صورت چارچوبهای موضوعی نمایش داده میشوند که میتوان قابهای موضوعی115 را به عنوان عبارتهایی با یک پرکننده در نظر گرفت.[25] مانند مثال ذیل:
“Murder of
این سیستم از چند پیمانه تشکیل شده است. یک پیمانه با این فرض که قابهایی از واژهها که با یکدیگر رخ میدهند با یکدیگر مرتبط نیستند، شبکه قاب موضوعی را، با مشخص کردن قابهای مرتبط میسازد. بنابراین با دادن قاب موضوعی، میتوان تمامی قابهای موضوعی که با آن قاب رخ میدهند را لیست کرد. به عنوان نمونه، برای مثال فوق میتوان انتظار داشت که “
یک پیمانه دیگر، قابهای موضوعی مرتبط با واژهها را مشخص مینماید. به این ترتیب که اگر دو واژه با یکدیگر رخ دهند، پس آنها با قابهای موضوعی یکدیگر مرتبط خواهندبود. بنابراین با داشتن یک قاب موضوعی میتوان تمام واژههایی که انتظار میرود با آن رخ دهند را لیست نمود. در نهایت نیز پیمانه دیگری با رابطهی میان قابها و نوع معنایی واژهها آموزش میبیند. این نوع معنایی از شبکه واژگانی استخراج میشود.
در سال ۲۰۰۶، برگسما116 و لین117 احتمال اینکه یک عبارت اسمی با کاندیداهای احتمالی خود هممرجع باشد را بر اساس مسیری که درخت تجزیه118ی میان آنها وجود دارد، محاسبه کردند. این اطلاعات به صورت خودکار و با استفاده از پایگاه دادهی بزرگی که در آن ساختار وابستگی119 جملات مشخص شده است، استخراج میشوند. به عنوان مثال، دو جملهی زیر را در نظر بگیرید:
مثال11:جان به دوستش نیاز دارد
مثال12:جان به حمایت او نیاز دارد
“His” و”John”در جمله اول به یک موجودیت اشاره دارند در صورتی در جمله دوم”His” و”John” نمیتوانند به یک موجودیت اشاره داشته باشند. چون یک فرد به حمایت خودش نیاز ندارد.[94]
با استفاده از این روش، ابتدا مسیرهای وابستگی میان دو عبارت اسمی استخراج میگردد. به عنوان نمونه مسیر وابستگی در مثال 11، برابرست با
