CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

موتور جستجوی پارسی اسناد الکترونیکی به کمک روش ریشه یابی و امتیازدهی دامنه فوریه

عنوان مقاله: موتور جستجوی پارسی اسناد الکترونیکی به کمک روش ریشه یابی و امتیازدهی دامنه فوریه
شناسه ملی مقاله: ISCEE10_184
منتشر شده در دهمین کنفرانس دانشجویی مهندسی برق ایران در سال 1386
مشخصات نویسندگان مقاله:

حامد شهبازی - گروه مهندسی کامپیوتر دانشگاه اصفهان
علیرضا مختاری پور
حمید محمدی
بهروز ترک لادانی

خلاصه مقاله:
بیشتر موتورهای جستجو حجم زیادی از اطلاعات ناخواسته را بر می گرداند. یکی از راههای جلوگیری از این امر اینست که اطلاعات بازگشتی بر حسب میزان ارتباط با کلید واژه ها مرتب شوند. روش جدیدی موسوم بهFDS یا امتیاز دهی دامنه فوریه که بر پایه تبدیل فوریه استوار شده است، می تواند جهت انجام این کار استفاده شود. روشFDS عملیات جداسازی و فیلتر کردن اسناد را بر اساس میزان محلی بودن کلید واژه ها در اسناد انجام می دهد. در این مقاله به شرح در مورد چگونگی پیاده سازی این روش و نیز نحوه استفاده از آن در پیاده سازی موتور جستجویALIA جهت جستجو در اسناد فارسی، پرداخته شده است. این روش در مقایسه با روشهای شناخته شده ی رایج همانند LSI و کسیونوس برداری دارای بازدهی بالاتری می باشد، که دلیل این امر در نیاز روش های مذکور به دامنه گسترده تری از اسناد برای تعیین موضوع اسناد است.

کلمات کلیدی:
موتور جستجوی ، تبدیل فوریه، ریشه یاب، فیلترینگ

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/127551/