
فلسطینیها، سرزمین چین، و سرخپوستان بومی آمریکا است.
GPE-SPE
گاهی اوقات نیز با موجودیتهایی مواجه میشویم که به نظر یکسان میآیند، اما چنین نیست. به عنوان مثال موجودیت فرانسه در ذیل، در هر جمله ارجاع متفاوتی را دنبال میکند.
فرانسه هفته گذشته توافق نامهای با آلمان امضاء کرد.
سیاسی سازمانی
GPE.ORG
تعطیلات فرانسه در ماه آگوست است.
سیاسی شخصی
GPE.PER
رهبران دنیا دیروز در فرانسه ملاقات داشتند.
سیاسی مکانی
GPE.LOC
فرانسه شکلات بهتری نسبت به نیوجرسی تولید میکند
سیاسی سیاسی
GPE.GPE
در چنین شرایطی لازم است تا به حالتهای خاص گفته شده در جدول 2-9 توجه داشته باشیم. 186
2-9: حالتهایخاص موجودیت سیاسی
توضیحات
مشخصه
سیاسی سازمانی
یک اشاره سیاسی سازمانی،اشارههای از موجودیت سیاسی هستند که به کل پیکره دولت اشاره میکنند. این مهم است که بین یک بخش از دولت یا تمام پیکره دولت تمایز قایل شویم.
GPE-ORG
سیاسی شخصی
همان طور که در بالا نیز گفته شد،جمعیتهای موجودیتهای سیاسی، به عنوان سیاسی شخصی، رفتار میکنند. به هرحال، گاهی اوقات تشخیص اینکه مرجع مردم،یک مرجع برای کل جمعیت است یا نه، کاری دشوار است.
GPE-PER
سیاسی مکانی
یک اشاره سیاسی مکانی، زمانی استفاده میشود که اشاره موجودیت سیاسی به طور کامل به یک موقعیت جغرافیائی از موجودیت سیاسی ارجاع داده میشود.
GPE-LOC
سیاسی سیاسی
نقش اشاره سیاسی سیاسی،بیش از سایر نقشهای سیاسی به کار میرود که یا یکبار اشاره شده و یا اینکه وقتی هیچ نقشی در متن نباشد، اشاره میشود.
GPE-GPE
2-2-4-2.کلاس هر موجوديت
هر موجودیت قابل برچسبگذاری باید با یک نوع کلاس مشخص شود؛ هر کلاس نوع ارجاع به موجودیتها در دنیای واقعی را مشخص میکند. دو نوع ارجاع برای هر اشاره میتوان در نظر گرفت؛ (1)ارجاعی و (2) غیر مستقیم. انواع اشارههای ارجاعی و غیرارجاعی برای عبارتهای اسمی به صورت ذیل تعریف میشوند:
2-2-4-2-1.غير ارجاعی187
یک موجودیت زمانی اشاره غیر ارجاعی محسوب میشود که برای ارجاع به کار نرود، به عبارت دیگر، یک اشاره غیر ارجاعی است اگر ویژگی (هایی) درباره موجودیت ارجاع شده توسط اشارهی دیگر در جملهای مشابه را بیان کند(اغلب به عنوان عطف بیان یا بخشی از گزاره در اشارهای دیگر است) و یا اگر یک موجودیت را در طی اصلاح مجدداً در عبارت مشابه را بیان کند.
2-2-4-2-2. ارجاعی 188
یک موجودیت ارجاعی است زمانیکه به یک موجودیت اشاره میکند نه به ویژگی یا خصوصیت یک موجودیت. به عبارت دیگر، یک اشاره ارجاعی یا یک موجودیت جدیدی را در سخن معرفی نماید و یا یک اصطلاح، نام یا عبارت توصیفی مشخص باشد که برای ارجاع به اشارهای که قبلاً در گفتمان آمده است به کار رود. هر موجودیت ارجاعی میتواند در یکی از چهار گروه ذیل قرار بگیرد.
2-2-4-2-2-1. ارزيابی به شکل منفی189
یک موجودیت زمانی به شکل منفی(NEG) است که به یک مجموعهی خاص از انواع موجودیتهای اشاره شده ارجاع میشود.190
مثال1: [ هیچ کس] ادعای مسئولیت پذیری نمیکند.
NOM-PER-IND-NEG
2-2-4-2-2-2. ارجاعی خاص
زمانیکه یک موجودیت به یک شیء یا مجموعهای از اشیاء خاص اشاره کند چه نویسنده یا خواننده از اسم موجودیت یا محل آن در دنیای واقعی آگاه باشد و چه نباشد، به عنوان اشاره ارجاعی خاص(SPC) در نظر گرفته میشوند.
مثال2:[ ایران] مهد تمدن و هنر است.
NOM-GPE-GPE-SPC
2-2-4-2-2-3.ارجاع عمومی
وقتی یک موجودیت، از نوع ارجاع عمومی( GEN ) است که به شیء یا مجموعهای از اشیاء که غیر خاص هستند، رجوع میکند، بیشتر موجودیتهای ارجاع عمومی به نوع یا گونه یا کلاس موجودیت اشاره میکنند.
مثال3:[معلمان] مهربان هستند.
NOM-PER-TLT-GEN
2-2-4-2-2-4. ارجاعی زير مشخص شده191
عبارات ارجاعی زیر مشخص شده(USP)، به ارجاعات غیر عمومی و غیر خاص اختصاص داده میشوند. این ارجاعات شامل عبارتهای اسمی کمی در متون معین، دور، شرطی، فرضی، منفی، نامشخص و سوالی میشوند. بهطورکلی کمیتها اغلب برچسب USP دارند مثل: تعداد کمی، بیشتر، برخی و…
مثال4:[بعضی از آمریکائیها] پیتزا دوست ندارند.
NOM-GPE-PER-USP
2-2-4-3. انواع اشاره / سطوح اشاره
برای هر موجودیت، ما تمام اشارههای آن موجودیت را مشخص و هممرجع میکنیم. همانطور که قبلاً هم گفته شد، یک موجودیت به شیء یا مجموعهای از اشیاء در دنیای واقعی منتسب میشود و یک اشاره، ارجاعی به یک موجودیت است. یک موجودیت میتواند نمایشهای متعددی داشته باشد، مثل اسم خاص، عبارت اسمی، ضمیر واسم عام.
اشارهها در سطوح مختلفی، طبقهبندی میشوند، در بالاترین سطح، دو نوع اصلی وجود دارد؛ اشاره ساده و اشاره پیچیده. تمایز این سطوح در این است که بعضی از اشارهها دارای ساختار نحوی پیچیده هستند که نمیتوانند به راحتی و بدون شکستنِ تحلیلهای نحوی و / یا اطلاعات گم شده برچسبگذاری شوند. زیرگروههای ذیل را میتوان برای انواع اصلی اشاره در نظر گرفت:
جدول 2-10: انواع طبقهبندی اشاره
اشارههای ساده
Named (NAM, NAMPRE)
نام ، نام خاص
Nominal (NOM, NOMPRE)
نام عام
Pronominal (PRO)
ضمایر
Headless nominal (HLS)
گروههای اسمی بدون هسته
Partitive Constructions (PTV)
ساختارهای وابسته
WH-Question words and specifiers (WHQ)
ضمایر پرسشی یا استفهام و حرفهای تعریف
اشارههای پیچیده
Apposition Constructions (APP)
ساختارهای بدل یا عطف بیان
Complex constructions taking a relative clause(ARC)
ساختارهای پیچیده با درنظر گرفتن بندهای وابسته
2-2-4-3-1. اشارههای ساده
اشارههای ساده، گروههای اسمی کامل هستند برای هر اشاره ساده باید محدوده کامل و هسته گروه اسمی را پیدا کنیم.
2-2-4-3-1-1. محدوده اشاره
محدوده یا حوزه اشاره شامل کل گروه اسمی میشود. در مورد ساختارهایی که ابهامهای جدانشدنی به عنوان وابستهها متصل وجود دارد، باید بیشترین محدوده را برای اشاره در نظر گرفت. در مثال «آن مردِ آموزگار را دیدم»، محدوده اشاره، عبارت [آن مردِ آموزگار] است. به طور کلی محدوده شامل تمام وابستههای عبارت یا گروه اسمی، عبارتهای اضافه و عبارتهای حرف اضافه و بندهای وابسته به آن میشود.
2-2-4-3-1-2. هسته اشاره
علاوه بر اینکه حوزهی یک گروه اسمی باید شناسایی شود، هستهی عبارت نیز باید انتخاب شود. البته در زبانهایی مثل پارسی، جایگاه هسته، در مواردی هسته آغاز و در مواردی هسته پایان و یا هسته وسط هستند. در پیکره لوتوس، اشارههای هسته را به صورت NOMH یا NAMH از سایر اشارهها متمایز میشود.
مثال5: «این سه کتابدار مرجع با دقت تمام به سؤالات پاسخ می دهند.»
2-2-4-3-1-3. انواع اشاره ساده
انواع اشارههای ساده در پیکره لوتوس، به صورت ذیل طبقهبندی میشوند:
الف)اشاره اسم خاص: در اکثر موارد، اشاره اسم خاص(NAM)، به نام یا نام مستعارِ هر موجودیت اطلاق میشود. به عبارت دیگر، اسم خاص، اسمی است که تنها به یک فرد یا شی اشاره دارد و همه را شامل نمیشود (مانند «علی»، «بیستون»، «ایران»).
ب اشاره اسم عام:اسم عام (NOM)، اسمی است که بر همه افراد و اشیاء و مفاهیم دلالت کند و بین همه آنها مشترک باشد (مانند «مهندس»، «مرد»). باید توجه داشت اسم عام میتواند به همراه یک ضمیر یا صفت اشاره، حالت اضافه یا حتی صفت بیان شود.
پ) اشاره ضمیر:اشاره ضمیر(PRO) نیز مانند ضمایر به جای اسم نشسته و با پذیرش نقشهای مختلف اسمی، از تکرار اسم جلوگیری میکنند.
ت) اشارههای بدون هسته:اشارههای بدون هسته(HLS)، ساختارهایی هستند که در آنها هسته به طور آشکار بیان نشده است. اگرچه این عبارات به طور تکنیکی فاقد هسته هستند، اما میتوان برای آنها هستهی جایگزین مناسب از وابستههای موجود انتخاب کرد.
مثال6:
ث) اشارههای وابسته192:در تعریف گروه اسمی، هر گروه از یک اسم به عنوان هسته ساخته میشود که میتواند یک یا چند وابسته نیز داشته باشد. ساختارهای وابسته را میتوان در گروههای ذیل در نظر گرفت:
مثال7: همين دو دانش آموز زرنگِ دبيرستان
ساختارهای وابسته به جزء193:این ساختارها دارای دو عنصر هستند: (1)بخش: این عنصر، فاقد هسته است و (2)کل: این عنصر ، کمّی است. همان طور که در مورد اشارههای بدون هسته گفته شد، عمل میکنیم. یعنی، عموماً سمت راستترین وابسته پیشین را به عنوان عنصر بخش در نظر میگیریم.
مثال8: {تعدادی} برای شرکت در جلسه برنامه ریزی کرده بودند
HLS-PER-GR-SPC
مثال9: {تعدادی از آنها} برای حضور در جلسه برنامه ریزی کرده بودند.
PTV-PER-GR-SPC
اشارههای وابسته پسین194:اشارههای وابستههای پسین (که همان وابستههای پیشین انگلیسی هستند)، اشارههایی هستند که در موقعیتی بعد از واژه(ها) قرار میگیرند. برای اینکه ساختار وابستههای پسین قابل نشانهگذاری باشند، باید با ساختار اشارههای اسم عام و خاص معادل باشد، مگر اینکه خودش بتواند در گروههای شخص، مکان، سازمان، و یا سیاسی، قرار بگیرد. به طور کلی هر اشاره وابسته پسین، میتواند به صورت وابستهی اشاره نام (NAMPOS) یا وابستهی اشاره اسم عام (NOMPOS) درنظر گرفتهشود.
مثال10: سربازان {اسرائیلی }
NAMPOS-GPE
2-2-4-3-2. ساختارهای پيچيده
هدف از این ساختارها، شناسائی ناحیههای پیچیدهای است که قوانین اشارههای ساده در مورد آنها صدق نمیکند. عموماً هسته را در ساختارهای پیچیده مشخص نمیکنند. در درون محدوده ساختارهای پیچیده، اشارههای ساده نشانهگذاری خواهند شد. هر کدام از این ساختارهای پیچیده تا حدی دارای قوانینی هستند.
2-2-4-4-2-1. ساختارهای عطف بيان/ بدل195
یک ساختاری است که در آن یک یا دو اشارهی کامل به یک موجودیت واحد ارجاع دارند. دو اشاره، در کنار هم قرار میگیرند، به طوری که یکی از آنها دیگری را توصیف یا تشریح میکند. در حالیکه این مسئله در حالتی که دو اسم پشت سر هم میآیند صادق نیست. در نشانهگذاری، اشاره عطف بیان196، به خودی خود دارای انتساب هسته نیست.
مثال11: رئیس جمهور روسیه، ولادیمیر پوتین
APP-PER-IND-SPC
الف) عطف بیانهای چند بخشی:این در زمانی است که بیش از دو عنصر وجود داشته باشد که در این حالت، همهی عناصر بعد از اولی به عنوان کلاس غیرارجاعی در نظر گرفته میشوند.
مثال12: ایران، سرزمین پهناور، مهد تمدن،
ب) عطف بیانهای نا منطبق: مثال 12 نمونهای از عطف بیانهای نامنطبق است.
مثال12: کاظمی و منوچهری، رئیس جمهور و وزیر
2-2-۵.جمعبندی:
به طور کلی در این بخش پیکره جدیدی با نشانهگذاری انواع اشارهها و اطلاعات هممرجعی را معرفی نمودیم. پیکره لوتوس شامل 4۰ متن نشانهگذاری شده است، که میتواند به عنوان یک منبع مناسب برای پژوهشهای مربوط به کشف اشاره و هممرجعی مورد استفاده قرار بگیرد.
فصل سوم
الگوریتمهای پيشنهادی
برای تشخيص مرجع مشترک
در این فصل به صورت اجمالی الگوریتمهای ارزیابی شده در این پایاننامه را بررسی کرده و زمینه تئوری آنها را شرح میدهیم.
3-1. ردهبندی دودويی
هدف از یادگیری با ناظر، فراگرفتن تابعی است که ورودیx∈X را به خروجی y∈Y بنگارد. یک یادگیر باناظر عموماً شامل ردهبندیدودویی (y={+1,-1}) ، ردهبندی چندتایی (y={1,…,k} به ازایk های کوچک) و یا رگرسیون (y=R) میباشد. به عنوان نمونهای از ردهبندی دودویی میتوان پیشبینی وضع هوا را در نظر گرفت که در آن آفتابی بودن هوای فردا بر اساس دادههایی که از وضع هوای روزهای قبل بدست آمدهاند، پیشبینی میشود. چنین تصمیمگیریهایی بر پایه یک تابع ویژگی، که به صورت φ:x→F نشان داده میشود و در آن F فضای ویژگیهاست، انجام میگیرد. به عنوان نمونه، در مثال قبل، φ(x) میتواند بیانگر اطلاعاتی همچون دما ، فشار جوی و تاریخ باشد. معمولا ، F برابر R^D است ، که R^D فضایی از بردارهای حقیقی D بعدی
