مقایسه زمان اجرا و حافظه مصرفی الگوریتمهای کاوش الگوهای نادر بر رویمجموعه دادههای مختلف

  • سال انتشار: 1395
  • محل انتشار: اولین همایش ملی فناوری اطلاعات، ارتباطات و محاسبات نرم
  • کد COI اختصاصی: ITCSC01_032
  • زبان مقاله: فارسی
  • تعداد مشاهده: 898
دانلود فایل این مقاله

نویسندگان

فرساد زمانی بروجنی

استادیار، دانشکده فنی و مهندسی دانشگاه آزاد اسلامی واحد اصفهان اصفهان ایران

زینب حسن پور

دکترا ، دانشکده فنی و مهندسی دانشگاه آزاد اسلامی واحد اصفهان اصفهان ایران

روح الله رشیدی

دکترا، دانشکده فنی و مهندسی دانشگاه آزاد اسلامی واحد سمیرم سمیرم ایران

سید ابراهیم هاشمی

دکترا، دانشکده فنی و مهندسی دانشگاه آزاد اسلامی واحد اصفهان اصفهان ایران

چکیده

در گذشته کاوش مجموعه اقلام نادر از بین دادههای ذخیره شده، مورد اهمیت قرار نمیگرفت اما امروزه برای مسائل مختلف داده کاوی از این الگو استفاده میشود. با گذشت زمان مسائلی در حوزه داده کاوی مطرح شد، که نیازمند کشف مواردی بود که از الگوی عام داده ها تبعیت نمیکرد. اهمیت بحث کشف موارد نادر نه تنها از کشف الگوهای عام کم اهمیتتر نیست، بلکه در مواردی از اهمیت بیشتری نیز برخوردار است . در این مقاله سه الگوریتم AprioriInverse ، AprioriRare ,CORI بر روی چهار مجموعه دادهی مختلف، از نظر زمان اجرا و حافظه مصرفی مورد بررسی قرار گرفت. الگوریتم AprioriRare نسبت به سایر الگوریتمها سریعتر اجرا شد، زیرا این روش در ابتدا بهینه سازی کرده و سپس به کاوش اقلام نادر میپردازد. از نظر حافظه مصرفی الگوریتم CORI نسبت به سایر الگوریتمها نتیجه بهتری داشت چون ابتدا مجموعه دادهها کاهش یافته و سپس ساختار درختی اطلاعات آنها تشکیل میشود

کلیدواژه ها

داده کاوی، الگوی نادر، مجموعه اقلام

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.