تشخیص ناهنجاری در داده های خط سیر با استفاده از تخمین تراکم مرکزی و خوشه بندی سلسله مراتبی
- سال انتشار: 1399
- محل انتشار: پنجمین کنفرانس ملی مهندسی کامپیوتر و بلاک چین ایران
- کد COI اختصاصی: CITCOMP05_060
- زبان مقاله: فارسی
- تعداد مشاهده: 705
نویسندگان
دانشگاه ادیبان ، گرمسار ، ایران
دانشگاه ادیبان ، گرمسار ، ایران
چکیده
در این تحقیق داده های خط سیر دو نقطه مشخص و به دست آوردن نمونه های ناهنجار مورد بررسی قرار گرفته است.ابتدا بااستفاده از معیارهای فاصله ،ماتریس فاصله را ایجاد می کنیم. از این ماتریس برای ایجاد کردن خوشه ها در روش خوشه بندیسلسله مراتبی استفاده می کنیم. ما در این تحقیق از روش Chameleon استفاده خواهیم کرد که به نوعی گراف در آن نقش اساسی دارد.از مزایای این روش می توان به پویا بودن مفهوم همسایگی اشاره کرد. در مرحله بعد پیدا کردن تعداد مطلوب خوشهها در روش خوشه بندی سلسله مراتبی مد نظر می باشد. در این حوزه روش ها و ایده های زیادی مطرح شده است. زانو در یک منحنی خطا روشی شناخته شده برای تعیین تعداد مناسب خوشه یا افرازها است. در این روش دستیابی به تعداد بهینهتعداد خوشه ها با درصد بالایی از دقت در دسترس خواهد بود. این روش برای جلوگیری از قرارگیری زانو (knee) در مکان غیر واقعی خود (ناشی از تاثیر داده های پرت)، همه نکات را در نظر می گیرد. در ادامه با به دست آمدن تعداد بهینه خوشه ها دادهها الگوریتم سلسله مراتبی می شود. خوشه های به دست آمده با تراکم بالا به عنوان داده های هنجار شناخته شده و خوشههای با تراکم بسیار پایین به عنوان ناهنجاری تلقی می شود.کلیدواژه ها
ناهنجاری، خط سیر، آنومالیمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.