CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

معرفی یک معیار شباهت حساس به پرسش برای خوشه بندی اسناد در سیستم های بازیابی اطلاعات متنی

عنوان مقاله: معرفی یک معیار شباهت حساس به پرسش برای خوشه بندی اسناد در سیستم های بازیابی اطلاعات متنی
شناسه ملی مقاله: ACCSI09_017
منتشر شده در نهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1382
مشخصات نویسندگان مقاله:

محمدرضا ولی زاده - بخش مهندسی و علوم کامپیوتر دانشگاه شیراز
منصور ذوالقدری جهرمی - بخش مهندسی و علوم کامپیوتر دانشگاه شیراز

خلاصه مقاله:
خوشه بندی در زم ینه بازیابی اطلاعات به صورت گسترده ای در ساله ای اخ یر با هدف بالا بردن سرعت و کارا یی س یستم مورد استفاده قرار گرفته است . ارتقاء کارا یی س یستم بر پا یه این فرض یه استوار است که اسناد مرتبط با یک پرسش خود شب یه یکدیگر هستند و انتظار می رود که در عمل خوشه بندی در یک خوشه قرار گ یرند . جهت عمل خوشه بندی یک مع یار شباهت مورد ن یاز است که با آن بتوان شباهت دو سند را اندازه گرفت . معیارهای شباهت ا یستا مانند کوس ینوس، شباهت دو سند را بدون توجه به پرسش کاربر محاسبه Query- ( می کنند و در نت یجه شباهت د و سند تحت پرشس های مختلف کاربر یکسان خواهد بود . معیارهای شباهت حساس به پرسشSensitive Similarity Measures( سعی در آشکار کردن شباهت دو سند تحت یک پرسش خاص را دارند . در این مقاله یک معی ار شباهت حساس به پرسش ارا یه شده است که با استفاده از چند ین مجموعه اسناد استاندارد در زم ینه ی باز یابی اطلاعات مورد ارز یابی قرار گرفته است و کارا یی آن با مع یار شباهت ا یستا که به پرسش توجهی ندارند و همچن ین با مع یارهای شباهت حساس به پرسش ارا یه شده توسط سایر محققان، مقا یسه شده است . نتایج آزما یش ها، نشان دهنده ی پ یشرفت قابل ملاحظه ی مع یار ارا یه شده است . بر اساس ا ین نتایج انتظار می رود که استفاده از این معیار پیشنهادی، باعث افزایش کارایی سیستم های بازیابی اطلاعات مبتنی بر خوشه بندی شود .

کلمات کلیدی:
خوشه بندی متن، معیارهای شباهت ، سیستم های بازیابی اطلاعات متنی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/45728/