
اساس FOAF را ارائه کردهاند. در این سیستم کاربران صاحب پروفایلهایی از نوع FOAF هستند که در آن اطلاعات کابران، ارتباطات آنها با دوستانشان و همچنین علائق موسیقیایی آنها تعریف شده است.(شکل 2-2)
شکل 2-2 :تعریف پروفایل کاربر در قالب FOAF [20]
سیستم برای کشف و جمعآوری اطلاعات موسیقیهای جدید و رویدادهای موسیقیایی پیشرو از فناوری RSS استفاده میکند. پس از آن با استفاده از یک هستیشناسی گروهها و هنرمندان شبیه به هم شناسایی میشوند. سپس این موردها بر طبق پروفایل هر کاربر امتیازدهی شده و بهترینها به وی پیشنهاد میشوند. آزمایشهای تجربی انجام گرفته حکایت از قدرت این سیستم در ارائه پیشنهادهای درست را دارد. در شکل 2-3 معماری این سیستم نشان داده شده است.
شکل 2-3 : معماری سیستم پیشنهادگر بر پایه FOAF [20]
در [21, 23] پاسانت40 و دکر41، دیبیرک را که یک سیستم پیشنهاد دهنده موسیقی مبتنی بر دادههای پیوندی است را معرفی کردهاند. دیبیرک با استفاده از الگوریتم فاصله معنایی دادههای پیوندی42 و اطلاعات 39000 هنرمند و گروه موسیقی موجود در دیبیپدیا به ارائه پیشنهاد در زمینه موسیقی میپردازد. اساس این پیشنهادها برپایهی روابط بین این هنرمندان و گروهها است. برای مثال رابطهای مانند هنرمند الف به همراه هنرمند ب به اجرای موسیقی پرداخته باشند، که یک رابطه مستقیم است. علاوه بر آن روابط پیچیدهتر هم مورد استفاده قرار میگیرند. مانند اجرای یک نوع موسیقی، داشتن قرارداد با یک شرکت تهیه و توزیع موسیقی و یا شرکت داشتن در یک حرکت فرهنگی.
دیبیرک علاوه بر ارائه پیشنهادها دلایل آنها را نیز به کاربران اعلام میکند. در شکل 2-4 پیشنهادهای ارائه شده که مرتبط با مایکل جکسون میباشند نشان داده شدهاند و در شکل 2-5 توضیح داده شده که به چه دلیل کویینسی جونز43 به عنوان یک پیشنهاد ارائه شده است.
شکل 2-4 یک نمونه از پیشنهاد دهی دیبیرک[24]
شکل 2-5 یک نمونه از ارائه دلایل مربوط به یک پیشنهاد در دیبیرک [24]
لنا-تیآر [22] توسط فرانز44 و همکارانش توسعه داده شده است. لنا هنگامی که کاربر به گردش در وب میپردازد، پیشنهادهایی را که اهمیت بیشتری در رابطه با RDF جاری که توسط کاربر دیده میشود، به وی ارائه میکند. لنا پیشنهادها را دستهبندی کرده و آنها را در گروههایی در دسترس کاربر قرار میدهد. لنا RDFها را به صورت قطبها45 و منابعی46 در نظر میگیرد و سپس میزان ارتباط بین موردهای این 2 دسته را محاسبه کرده و امتیاز دهی را بر آن اساس انجام میدهد. لنا-تیآر از روش رتبهبندی سهگانه47 برای تولید این امتیازها استفاده میکند [25]. در این روش گراف دادههای پیوندی به تنسورهای مجاورتی تبدیل میشوند سپس از طریق یک شیوه متعامدسازی مانند پارافک48 به ماتریسهایی سازنده تبدیل میشوند که امتیازات قطبی و منبعی از روی آنها محاسبه میشوند.
در [26] مفهوم جدیدی از سیستمهای پیشنهادگر را بنام سیستمهای پیشنهادگر باز معرفی میکند. وجود این سیستمها به ذات باز دادههای پیوندی باز میگردد که مجموعه دادههای متفاوتی بر روی آن وجود دارد و از طرفی امکانات بیشماری جهت ترجمه از یک قالب به قالب دیگری از مجموعههای داده وجود دارد. در پایان امکان وجود پیوندهای فرای مجموعه داده متفاوت که آنها را به هم وصل میکند بسیار مفید است.
استفاده از منابع مختلف در ساخت پروفایل کاربران و موردها میتواند مشکل شروع سرد کاربران، و موردها و همچنین خلوتی را حل کند زیرا استفاده از منابع مختلف امکان پیدا کردن ردهای مختلف از کاربران و موردها را افزایش میدهد.
2-6 جمعبندی
سرویسهای پیشنهاد دهنده از میان حجم عظیمیاز اطلاعات و گزینههای موجود، سعی میکنند تا بهترین انتخابهای ممکن را در اختیار کاربران قرار دهند. جرقههای اولیه این شاخه تحقیقاتی از اواسط دهه 70 میلادی زده شد اما از اواخر دهه 90 به شاخهی تحقیقاتی مستقل تبدیل شد. این نوع از خدمات نقش مهمیرا در تجارت الکترونیک خصوصا در شاخهی B2C ایفا میکنند. با توجه به گستره زیاد کاربردهای این زمینه در تجارت الکترونیکی و خدمات مبتنی بر وب روشها و الگوریتمهای بسیاری جهت حل مسائل مختلف درگیر با این موضوع پیشنهاد شده است. در این فصل، در ابتدا تاریخچهای از سامانههای پیشنهاد دهنده به همراه توضیح مختصری از روشها و پیادهسازیهای مهم و اثر گذار بر این حیطه ارائه شد. سپس روشهای مختلف براساس طبقه بندیهای موجود مورد بحث قرار گرفتند و مزایا و معایب هر تکنیک بیان گردید.
فصل سوم
مروری بر دادههای پیوندی و نظریه غذایابی
3-1 مقدمه
در این بخش مفاهیم پایهای شامل 49RDF، دادههای پیوندی و نظریه غذایابی بهینه توضیح داده خواهند شد. این فصل به سه بخش تقسیم شده است. در اولین بخش ساختار RDFها بررسی میگردد و در بخش دوم مفهوم دادههای پیوندی، چگونگی پیدایش و وضعیت فعلی آن و در سومین بخش نظریه غذایابی بهینه مورد بررسی قرار خواهد گرفت.
RDF یک قالب ارائه و ذخیره اطلاعات معنایی با قابلیت پردازش ماشینی است. اجزای پایهای تشکیل دهندهی این استاندارد عبارت از منابع50 ، ویژگیها51 و گزارهها52 هستند. دادههای پیوندی مجموعهای از
مجموعه دادههای معنایی متصل به هم در قالب RDF است که امکان گشت و گذار ماشینی و انسانی در بین آنها فراهم شده است. پیوندهای بین اطلاعات این مجموعه دادهها دارای نوع میباشند.
نظریه چرای اطلاعاتی در دهه نود همراه با پدیده انفجار اطلاعات مطرح شد. اساس این نظریه بر شباهتهای بسیار زیاد رفتار انسان جهت دستیابی به اطلاعات مورد نیازش با رفتار دیگر جاندارن هنگام پیدا کردن غذا بنا شده است. الگویی که انسان برای یافتن اطلاعات استفاده میکند. همانطور که جانوران از اطلاعات غیر کامل محیطی استفاده میکنند. انسانها نیز مانند حیوانات از نشانههایی استفاده میکنند تا تصمیم بگیرند آیا رد اطلاعاتی را دنبال کنند یا خیر.
3-2 ایده اصلی RDF
RDF یک قالب ارائه و ذخیره اطلاعات معنایی قابل پردازش و فهم توسط ماشین است. RDF میتواند به دو شکل باینری و XML تعریف و استفاده شود. اما قالب XML بسیار پذیرفتهتر است و بیشتر کاربردهای استفاده کننده از آن، از جمله دادههای پیوندی و نرمافزارها و سیستمهای تجاری و دانشگاهی از این قالب پشتیبان میکنند .اجزای پایهای تشکیل دهندهی این استاندارد عبارت از منابع53 ، ویژگیها54 و گزارهها55 هستند که در ادامه تشریح خواهند شد. با اینکه این سه عنصر در استاندارد RDF عناصر پایهای تشکیل دهندهی آن هستند، اما ویژگیها خود نوعی منبع هستند و گزارهها میتوانند از منابع تشکیل شده باشند [27]. مدل RDF داده را در قالب سهگانه موضوع، گزاره، شیء کدگزاری میکند. هر دوی موضوع و شیء، در یک سهگانه شناسه همسان منابع هستند، که هر کدام یک منبع را شناسایی میکند یا به ترتیب یک شناسه همسان منابع و یک رشته حرفی.گزاره، نحوه ارتباط موضوع و شیء را مشخص میکند که البته گزاره هم با یک شناسه همسان منابع نمایانده میشود.
به عنوان مثال میتواند ارتباط دو نفر A وB ( که هر کدام با یک شناسه همسان منابع شناسانده میشوند) را بر پایه این حقیقت که A و B را میشناسد بیان کند. به طرز مشابه یک سهگانه RDF میتواند شخص C را به مقاله علمیD که در یک پایگاه داده فهرست کتب قرار دارد مرتبط کند با این بیان که C نویسنده D است. دو منبعی که به این ترتیب متصل شده اند میتوانند از دو مجموعه متفاوت روی وب کشیده شوند به طوری که داده روی منبع داده اولی بتواند به داده روی منبع دوم متصل شود و به این وسیله یک وب داده ایجاد شود.
نتیجتاً میتوان به سهگانههای RDF ای فکر کرد که موردهایی را از مجموعه دادههای مختلف به هم متصل میکنند به همان ترتیب که پیوندهای فرامتنی وب اسناد را به هم وصل میکنند. پیوندهای RDF، شکل سهگانه RDF را میگیرند که موضوع سهگانه، یک منبع شناسه همسان منابع در فضای نام یک مجموعه داده باشد در حالی که شیء و سهگانه یک منبع شناسه همسان منابع در دیگر مجموعه داده باشد.
شکل 3-1: نمونه ای از پیوندهای RDF
شکل 3-1 نمونه ای از پیوندهای RDF را نشان میدهد. پیوند اول بیانگر این موضوع است که منبع شناسایی شده با شناسه همسان منابع http://www.org/people/Berners-lee/card#i عضوی از منبع http://dig.csail.mit.edu/data#DIG است.
3-2-1 منابع
میتوان منابع را یک “شیء” یا بطور کلیتر یک “چیز” پنداشت. این “چیز” میتواند در جهان واقعی یک نمونه فیزیکی داشته باشد و یا یک مفهوم صرفا انتزاعی باشد. نویسندگان، ناشرها، مکانها، آدمها، پیوندها، اتاقها، پرس و جوها و هر چیز دیگری میتواند در قالب RDF توصیف شود [27]. هر منبع دارای یک شناسه همسان منابع56 است. شناسه همسان منابع میتواند یک آدرس وب و یا هر نوع شناسه منحصر به فرد دیگری باشد، که بتواند بطور یکتا یک منبع RDF را مشخص سازد . قابل ذکر است که یک شناسه الزاماً موجب دسترسی به منبع نمیشود. یعنی دنبال کردن یک شناسه همیشه به بازیابی57 یک منبع بر روی وب منتهی نخواهد شد. یک نمونه از این شناسهها شناسههای همسان 303 هستند که در همین فصل معرفی خواهند شد. شناسه همسان منابع بهگونهای تعریف میشود که نه تنها برای مکانهای وب ، بلکه برای شی ءهای گوناگونی نظیر شمارههای تلفن، شمارههای ISBN نشریات و کتابها و مکانهای جغرافیایی نیز قابل استفاده باشد.
3-2-2 ویژگیها
ویژگیها نوع خاصی از منابع هستند که خصوصیتی از یک منبع را نشان میدهد و یا روابط بین منابع را توصیف میکنند [27]، مانند “نوشته شده توسط” ، “متولد سال” ، “خریده شده توسط” و نظایر آنها. از این نظر ویژگیها در استاندارد RDF شبیه ویزگیها در شیءگرایی میباشند. آنجایی که منابع به هم متصل میشوند، هر دو منبع فقط از طریق یک ویژگی میتوانند به یکدیگر متصل شوند. در RDFویژگیها هم با شناسه همسان منابع شناسایی میشوند.
بطور کلی ایده استفاده از شناسه همسان منابع برای شناسایی “چیز”ها و روابط بین آنها بسیار مهم است چرا که به این ترتیب امکان استفاده از یک شمای نامگذاری منحصر به فرد در سرتاسر دنیا وجود خواهد داشت، و از بسیاری مشکلات ناهمگونی، که مانع ارائه داده توزیع شده بودند کاسته خواهد شد.
3-2-3 گزارهها
اگر مدل RDF به صورت یک گراف در نظر گرفته شودگزارهها یالهای آن گراف هستند. هر گزاره حقیقتی را از طریق یک ویژگی درباره یک یا دو منبع بیان میکند. برای مثال عبارت “ساختمان داده توسط دکتر رفیعی تدریس میشود” یک گزاره است. این گزاره با استفاده از ویژگی “تدریس شدن” دو منبع “دکتر رفیعی” و “ساختمان داده” را به یکدیگر متصل میکند. همانطور که پیداست حقیقت مطرح شده در مورد هر دو منبع معتبر است. بطور رسمی گزاره یک سهگانه است متشکل از یک منبع، یک ویژگی و مقدار آن ویژگی است که بیان کننده حقیقتی باشند [27]. در این تعریف مقدارها میتوانند منابع یا الفاظ باشند. الفاظ مقادیر تجزیه ناپذیر (رشته ای) هستند. شکل 3-2 گزاره مطرح شده را نشان میدهد.
شکل 3-2: یک گزاره متشکل از دو منبع و یک صفت سازنده یک رابطه
3-2-4 نمونه یک گزاره
امید رفیعی مالک صفحه وب http://www.ui.ac.ir/comp/~ds است. ساده ترین راه تفسیر گزاره فوق استفاده از تعریف ارائه شده و لحاظ کردن سهگانه
(http://ui.ac.ir/comp/~ds, http://www.mydomain.org/siteowner, #OmidRafi’ee)
است. میتوان این سهگانه (x,p,y) را یک رابطه منطقی به صورت p(x,y) دانست. به این ترتیب که گزاره خبری دوگانی p، شیء x را به شیءy مرتبط میکند. در حقیقت آنچه RDF عرضه میکند، گزارههای خبری دو گانه است. توجه داشته باشید که ویژگی” مالک سایت” و دو شیءمذکور همه با شناسه همسان منابع شناسایی میشود. تصویر 3-3 همان گزاره قبلی را به شکل گراف جهت دار با گرهها و یالهای بر چسب دار نشان میدهد.
شکل 3-3: گزاره “امید رفیعی مالک صفحه وب http://www.ui.ac.ir/comp/~ds است”
جهت یالها از سمت تابع (موضوع در گزاره) به سمت مقدار (شیء در گزاره) است.
گرافها ابزا
