رده بندی با استفاده از ترکیب قوانین انجمنی و درخت تصمیم

  • سال انتشار: 1387
  • محل انتشار: دومین کنفرانس داده کاوی ایران
  • کد COI اختصاصی: IDMC02_121
  • زبان مقاله: فارسی
  • تعداد مشاهده: 2847
دانلود فایل این مقاله

نویسندگان

مژگان پورحسن

گلناز اتابکی

بهروز مینایی بیدگلی

چکیده

در این مقاله، مدل جدیدی برای رده بندی ترکیبی ، بر مبنای قوانین انجمنی و درخت تصمیم ارائه شده است. درخت های تصمیم یکی از رایج ترین مدل های رده بندی هستند، با این وجود، در مواردی که یک یا چند خصیصه در مجموعه داده مقدار مشخصی ندارند، با مشکل مواجه می شوند. با استفاده از قوانین انجمنی می توان این مشکلات را رفع نمود. در این روش، ابتدا قوانین انجمنی کشف می شوند و بر مبنای بهترین آنها درخت تصمیم ساخته می شود. در این مدل ایجاد توازن میان عمق و دقت درخت تصمیم از اهمیت زیادی برخوردار است، و در الگوریتم پیشنهادی، این کار به کمک اتوماتیک کردن تعیین آستانه معیارهای ارزیابی قوانین انجمنی و ترکیب آنها انجام می شود. در نهایت، نتایج اعمال این مدل، بر دادگان Vote با تعدادی از الگوریتم های رده بندی موجود مورد مقایسه و ارزیابی قرارمی گیرد. مدل ارائه شده، به عنوان یک مؤلفه، به ابزار داده کاوی WEKA اضافه شده است. WEKA یک محیط داده کاوی، با منبع باز، با زبان Java و شامل الگوریتم های متعدد داده کاوی و یادگیری ماشین است.

کلیدواژه ها

؛ رده بندی؛ درخت تصمیم؛ قوانین انجمنی؛ یادگیری باناظر WEKA

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.