تاثیر خصوصیات فایل شاخص بردقت بازیابی اطلاعات
محل انتشار: سومین کنفرانس داده کاوی
سال انتشار: 1388
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 3,404
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IDMC03_002
تاریخ نمایه سازی: 13 دی 1389
چکیده مقاله:
با توجه به افزایش حجم داده ها در عصر اطلاعات وقت و هزینهه قابل توجهی جهت دسته بندی و جستجوی داده ها صرف می گردد که نیاز به روش ها و مدلهای جدید داده کاوی بیش از پیش مشهود است خصوصا این نیاز در مورد وب که بزرگترین پایگاه اطلاعات عمومی است ضروری تر می نماید دراین خصوص دو عامل حجم و تنوع اطلاعات به همراه تعداد رو به رشد کاربران چالش بزرگی را در زمینه فرایند داده کاوی بوجود اورده است شایان ذکر است که یکی از فرایندهای اصلی در سیستمهای جستجوگر شاخص گذاری اطلاعات است که ارتباط مستقیم با تعداد اسناد موجوددر پایگاه دارد تحقیقات اخیر نشان میدهد که زمان شاخص گذاری با افزایش تعداد اسناد موجود در پایگاه داده به شدت افزایش می یابد تحقیق حاضر به بررس یخصوصیات اسناد یک پایگاه داده بزرگ و استاندارد شامل پرونده های جمع اوری شده از وب پرداخته است این خصوصیات شامل تعداد، نوع، و اندازه اسناد که تاثیر آنها بر ساختار فایل شاخص و فرایند شاخص گذاری مورد بررسی قرارگرفته است.
کلیدواژه ها:
نویسندگان
سهیلا کرباسی
استادیار گروه کامپیوتر دانشگاه گلستان
مهدی یعقوبی
مربی کامپیوتر دانشگاه گلستان