داده کاوی در داده های عظیم: یافتن نزدیک ترین همسایه به کمک درهمسازی میانی

مهدی محمدیان

داده کاوی در داده های عظیم: یافتن نزدیک ترین همسایه به کمک درهمسازی میانی

محل انتشار: شانزدهمین همایش ملی پژوهش های نوین در علوم و فناوری

سال انتشار: 1397

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 637

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/932732

شناسه ملی سند علمی:

EMAA16_029

تاریخ نمایه سازی: 7 مهر 1398

چکیده مقاله:

یکی از مسائل اساسی در داده کاوی داده های عظیم، یافتن نزدیک ترین همسایه به یک بردار مورد پرسوجوست. حجم انبوهی از داده ها که ممکن است ابعاد بالائ ی نیز داشته باشند، با استفاده از یک معیار فاصله یا شباهت جهت یافتن نزدیک ترین همسایه کنکاش می شوند. وجود این حجم عظیم از داده ها بر روی حافظه های مانا و پرهزینه بودن عملیا ت های ورودی/خروجی جهت یافتن نزدیک ترین همسایه، سبب شده است تا مسئله یافتن نزدیک ترین همسایه از نظر زمان و فضا بسیار پرهزینه باشد. تحقیقات گسترده ای که پیرامون این مسئله صورت گرفته است منجر به هور الگوریتم های شده است که قادرند با استفاده از توابع درهمساز، نزدیک ترین همسایه تقریبی یک پرس و جو را که تقریب آن قابل قبول باشد، به عنوان خروجی برگردانند. به این دسته از توابع، توابع درهمساز میانی گفته می شود. این الگوریتم ها توانسته اند از نظر دقت، فضا و زمان، عملکرد مناسبی را از خود نشان دهند. در این مقایسه قصد داریم تا به صورت کلی به معرفی این دسته از الگوریتم ها بپردازیم

کلیدواژه ها:

داده کاوی ، داده های عظیم ، نزدیک ترین همسایه ، درهمسازی ، درهمسازی میانی

نویسندگان

مهدی محمدیان

مربی، دانشکده مهندسی کامپیوتر، دانشگاه پیام نور تهران ایران / دانشجوی مقطع دکتری، گرایش نرم افزار، دانشگاه علم و صنعت، تهران