ارائه یک مدل جدید از فاصله بین کلمات پرس و جو براساس حداقل جابجایی
سال انتشار: 1396
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 123
فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JSCIT-6-2_001
تاریخ نمایه سازی: 25 مهر 1403
چکیده مقاله:
براساس تحقیقات انجام شده روی موتورهای جستجو، اکثر پرس وجوهای کاربران بیش از یک کلمه می باشد. برای پرس وجوها با بیش از یک کلمه دو مدل می توان ارائه کرد. در مدل اول فرض می شود کلمات پرس وجو مستقل از یکدیگر هستند و در مدل دوم محل و ترتیب کلمات وابسته فرض می شود. آزمایش ها نشان می دهد که در اکثر پرس وجوها بین کلمات وابستگی وجود دارد. یکی از پارامترهایی که می تواند وابستگی بین کلمات پرس وجو را مشخص کند فاصله ی بین کلمات پرس وجو در سند است. در این مقاله تعریف جدیدی از فاصله براساس حداقل جابجایی کلمات سند به منظور تطبیق بر پرس وجو ارائه می گردد. همچنین با توجه به این که اکثر الگوریتم های رتبه بندی از فرکانس رخداد یک کلمه در سند (Term Frequency) برای امتیازدهی به اسناد استفاده می کنند و برای پرس وجو با بیش از یک کلمه تعریف روشنی از این پارامتر وجود ندارد؛ در این مقاله پارامترهای فرکانس رخداد یک عبارت (Phrase Frequency) و معکوس فرکانس سند (Inverted Document Frequency) با توجه به مفهوم جدید فاصله تعریف شده است و الگوریتم هایی برای محاسبه آن ها ارائه گردیده است. همچنین نتایج الگوریتم پیشنهادی با الگوریتم پیاده سازی شده توسط نمایه ساز متن باز لوسین مقایسه شده است که افزایش خوبی را در میانگین دقت نشان می دهد.
کلیدواژه ها:
نویسندگان
Javad Paksima
گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور، ایران
Alimohammad Zare Bidoki
دانشکده برق و کامپیوتر، دانشگاه یزد، یزد، ایران
Vali Derhami
دانشکده برق و کامپیوتر، دانشگاه یزد، یزد، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :