داده کاوی در داده های عظیم: یافتن نزدیک ترین همسایه به کمک درهمسازی میانی

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 430

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

EMAA16_029

تاریخ نمایه سازی: 7 مهر 1398

چکیده مقاله:

یکی از مسائل اساسی در داده کاوی داده های عظیم، یافتن نزدیک ترین همسایه به یک بردار مورد پرسوجوست. حجم انبوهی از داده ها که ممکن است ابعاد بالائ ی نیز داشته باشند، با استفاده از یک معیار فاصله یا شباهت جهت یافتن نزدیک ترین همسایه کنکاش می شوند. وجود این حجم عظیم از داده ها بر روی حافظه های مانا و پرهزینه بودن عملیا ت های ورودی/خروجی جهت یافتن نزدیک ترین همسایه، سبب شده است تا مسئله یافتن نزدیک ترین همسایه از نظر زمان و فضا بسیار پرهزینه باشد. تحقیقات گسترده ای که پیرامون این مسئله صورت گرفته است منجر به هور الگوریتم های شده است که قادرند با استفاده از توابع درهمساز، نزدیک ترین همسایه تقریبی یک پرس و جو را که تقریب آن قابل قبول باشد، به عنوان خروجی برگردانند. به این دسته از توابع، توابع درهمساز میانی گفته می شود. این الگوریتم ها توانسته اند از نظر دقت، فضا و زمان، عملکرد مناسبی را از خود نشان دهند. در این مقایسه قصد داریم تا به صورت کلی به معرفی این دسته از الگوریتم ها بپردازیم

نویسندگان

مهدی محمدیان

مربی، دانشکده مهندسی کامپیوتر، دانشگاه پیام نور تهران ایران / دانشجوی مقطع دکتری، گرایش نرم افزار، دانشگاه علم و صنعت، تهران