یافتن داده های پرت با استفاده از انتخاب تصادفی

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 509

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSCG03_193

تاریخ نمایه سازی: 14 فروردین 1399

چکیده مقاله:

یافتن داده های پرت 1یا نقاط دور افتاده به عنوان یکی از زمینه های داده کاوی، به منظور مشخص کردن داده هایی ارائه می شود که نسبت به داده های اطراف خود متمایز می باشند. این مسئله یکی از مسائل مهم داده کاوی بوده که در زمینه های بسیاری مورد تحقیق قرار گرفته است. در این مقاله یک روش تکراری برای پیدا کردن داده های پرت ارائه می شود. داده های مورد استفاده در این تحقیق داده های دو بعدی می باشند. تشخیص داده های پرت در محیط هایی با تراکم متفاوت، مشخصه این الگوریتم است. ایده اصلی آن به انتخاب تصادفی داده ها پرداخته و با بسط دادن خوشه های اطراف داده تصادفی، داده های پرت را از عدم حضور در خوشه ها شناسایی شده، تشخیص می دهد. در نهایت این روش بر روی برخی نمونه داده ها بررسی شده، که نتایج نشان می دهد شناسایی داده های پرت بدون توجه به پراکندگی داده های اطراف آن، به درستی انجام شده است.

نویسندگان

داود ستوده

دپارتمان مهندسی برق و کامپیوتر، دانشکده منتظری، دانشگاه فنی و حرفه ای استان خراسان رضوی-ایران