معرفی یک معیار شباهت حساس به پرسش برای خوشه بندی اسناد در سیستم های بازیابی اطلاعات متنی

سال انتشار: 1382
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,954

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI09_017

تاریخ نمایه سازی: 4 بهمن 1386

چکیده مقاله:

خوشه بندی در زم ینه بازیابی اطلاعات به صورت گسترده ای در ساله ای اخ یر با هدف بالا بردن سرعت و کارا یی س یستم مورد استفاده قرار گرفته است . ارتقاء کارا یی س یستم بر پا یه این فرض یه استوار است که اسناد مرتبط با یک پرسش خود شب یه یکدیگر هستند و انتظار می رود که در عمل خوشه بندی در یک خوشه قرار گ یرند . جهت عمل خوشه بندی یک مع یار شباهت مورد ن یاز است که با آن بتوان شباهت دو سند را اندازه گرفت . معیارهای شباهت ا یستا مانند کوس ینوس، شباهت دو سند را بدون توجه به پرسش کاربر محاسبه Query- ( می کنند و در نت یجه شباهت د و سند تحت پرشس های مختلف کاربر یکسان خواهد بود . معیارهای شباهت حساس به پرسشSensitive Similarity Measures( سعی در آشکار کردن شباهت دو سند تحت یک پرسش خاص را دارند . در این مقاله یک معی ار شباهت حساس به پرسش ارا یه شده است که با استفاده از چند ین مجموعه اسناد استاندارد در زم ینه ی باز یابی اطلاعات مورد ارز یابی قرار گرفته است و کارا یی آن با مع یار شباهت ا یستا که به پرسش توجهی ندارند و همچن ین با مع یارهای شباهت حساس به پرسش ارا یه شده توسط سایر محققان، مقا یسه شده است . نتایج آزما یش ها، نشان دهنده ی پ یشرفت قابل ملاحظه ی مع یار ارا یه شده است . بر اساس ا ین نتایج انتظار می رود که استفاده از این معیار پیشنهادی، باعث افزایش کارایی سیستم های بازیابی اطلاعات مبتنی بر خوشه بندی شود .

کلیدواژه ها:

خوشه بندی متن ، معیارهای شباهت ، سیستم های بازیابی اطلاعات متنی

نویسندگان

محمدرضا ولی زاده

بخش مهندسی و علوم کامپیوتر دانشگاه شیراز

منصور ذوالقدری جهرمی

بخش مهندسی و علوم کامپیوتر دانشگاه شیراز