تاثیر خصوصیات فایل شاخص بردقت بازیابی اطلاعات

سال انتشار: 1388
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 3,405

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDMC03_002

تاریخ نمایه سازی: 13 دی 1389

چکیده مقاله:

با توجه به افزایش حجم داده ها در عصر اطلاعات وقت و هزینهه قابل توجهی جهت دسته بندی و جستجوی داده ها صرف می گردد که نیاز به روش ها و مدلهای جدید داده کاوی بیش از پیش مشهود است خصوصا این نیاز در مورد وب که بزرگترین پایگاه اطلاعات عمومی است ضروری تر می نماید دراین خصوص دو عامل حجم و تنوع اطلاعات به همراه تعداد رو به رشد کاربران چالش بزرگی را در زمینه فرایند داده کاوی بوجود اورده است شایان ذکر است که یکی از فرایندهای اصلی در سیستمهای جستجوگر شاخص گذاری اطلاعات است که ارتباط مستقیم با تعداد اسناد موجوددر پایگاه دارد تحقیقات اخیر نشان میدهد که زمان شاخص گذاری با افزایش تعداد اسناد موجود در پایگاه داده به شدت افزایش می یابد تحقیق حاضر به بررس یخصوصیات اسناد یک پایگاه داده بزرگ و استاندارد شامل پرونده های جمع اوری شده از وب پرداخته است این خصوصیات شامل تعداد، نوع، و اندازه اسناد که تاثیر آنها بر ساختار فایل شاخص و فرایند شاخص گذاری مورد بررسی قرارگرفته است.

نویسندگان

سهیلا کرباسی

استادیار گروه کامپیوتر دانشگاه گلستان

مهدی یعقوبی

مربی کامپیوتر دانشگاه گلستان