تشخیص ناهنجاری در داده های خط سیر با استفاده از تخمین تراکم مرکزی و خوشه بندی سلسله مراتبی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 610

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CITCOMP05_060

تاریخ نمایه سازی: 22 مرداد 1399

چکیده مقاله:

در این تحقیق داده های خط سیر دو نقطه مشخص و به دست آوردن نمونه های ناهنجار مورد بررسی قرار گرفته است.ابتدا بااستفاده از معیارهای فاصله ،ماتریس فاصله را ایجاد می کنیم. از این ماتریس برای ایجاد کردن خوشه ها در روش خوشه بندیسلسله مراتبی استفاده می کنیم. ما در این تحقیق از روش Chameleon استفاده خواهیم کرد که به نوعی گراف در آن نقش اساسی دارد.از مزایای این روش می توان به پویا بودن مفهوم همسایگی اشاره کرد. در مرحله بعد پیدا کردن تعداد مطلوب خوشهها در روش خوشه بندی سلسله مراتبی مد نظر می باشد. در این حوزه روش ها و ایده های زیادی مطرح شده است. زانو در یک منحنی خطا روشی شناخته شده برای تعیین تعداد مناسب خوشه یا افرازها است. در این روش دستیابی به تعداد بهینهتعداد خوشه ها با درصد بالایی از دقت در دسترس خواهد بود. این روش برای جلوگیری از قرارگیری زانو (knee) در مکان غیر واقعی خود (ناشی از تاثیر داده های پرت)، همه نکات را در نظر می گیرد. در ادامه با به دست آمدن تعداد بهینه خوشه ها دادهها الگوریتم سلسله مراتبی می شود. خوشه های به دست آمده با تراکم بالا به عنوان داده های هنجار شناخته شده و خوشههای با تراکم بسیار پایین به عنوان ناهنجاری تلقی می شود.

کلیدواژه ها:

نویسندگان

محمدرضا عباسی فرد

دانشگاه ادیبان ، گرمسار ، ایران

میثم بیات

دانشگاه ادیبان ، گرمسار ، ایران