تشخیص ناهنجاری در داده های خط سیر با استفاده از تخمین تراکم مرکزی و خوشه بندی سلسله مراتبی
سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 610
فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CITCOMP05_060
تاریخ نمایه سازی: 22 مرداد 1399
چکیده مقاله:
در این تحقیق داده های خط سیر دو نقطه مشخص و به دست آوردن نمونه های ناهنجار مورد بررسی قرار گرفته است.ابتدا بااستفاده از معیارهای فاصله ،ماتریس فاصله را ایجاد می کنیم. از این ماتریس برای ایجاد کردن خوشه ها در روش خوشه بندیسلسله مراتبی استفاده می کنیم. ما در این تحقیق از روش Chameleon استفاده خواهیم کرد که به نوعی گراف در آن نقش اساسی دارد.از مزایای این روش می توان به پویا بودن مفهوم همسایگی اشاره کرد. در مرحله بعد پیدا کردن تعداد مطلوب خوشهها در روش خوشه بندی سلسله مراتبی مد نظر می باشد. در این حوزه روش ها و ایده های زیادی مطرح شده است. زانو در یک منحنی خطا روشی شناخته شده برای تعیین تعداد مناسب خوشه یا افرازها است. در این روش دستیابی به تعداد بهینهتعداد خوشه ها با درصد بالایی از دقت در دسترس خواهد بود. این روش برای جلوگیری از قرارگیری زانو (knee) در مکان غیر واقعی خود (ناشی از تاثیر داده های پرت)، همه نکات را در نظر می گیرد. در ادامه با به دست آمدن تعداد بهینه خوشه ها دادهها الگوریتم سلسله مراتبی می شود. خوشه های به دست آمده با تراکم بالا به عنوان داده های هنجار شناخته شده و خوشههای با تراکم بسیار پایین به عنوان ناهنجاری تلقی می شود.
نویسندگان
محمدرضا عباسی فرد
دانشگاه ادیبان ، گرمسار ، ایران
میثم بیات
دانشگاه ادیبان ، گرمسار ، ایران