CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود بکارگیری ابزار های داده کاوی جهت انتشار داده ها در مسائل دسته بندی با استفاده از ابزارهای داده کاوی

عنوان مقاله: بهبود بکارگیری ابزار های داده کاوی جهت انتشار داده ها در مسائل دسته بندی با استفاده از ابزارهای داده کاوی
شناسه ملی مقاله: CITCOMP01_131
منتشر شده در کنفرانس بین المللی مهندسی کامپیوتر و فناوری اطلاعات در سال 1395
مشخصات نویسندگان مقاله:

سمیه عبادی - دپارتمان مهندسی کامپیوتر، دانشگاه پیام نور، تهران
معزالدین حجت الاسلامی - دپارتمان مهندسی کامپیوتر، دانشگاه مالک اشتر ، تهران

خلاصه مقاله:
یکی از مراحل اساسی در فرآیند کشف دانش در پایگاه داده ها، فاز انتشار داده ها است. برای نتیجه گیری مناسب از یک داده کاوی، این فاز از اهمیت خاصی برخوردار است چرا که اگر داده ها به طور صحیح آماده نشده باشند، نتایج تمام فاز های بعدی فرآیند به خطر می افتند. DMPML چهارچوبی است که داده های از پیش پردازش شده را برای الگوریتم های مختلف داده کاوی در یک سند XML ذخیره می کند و کد گذاری صحیح را با استفاده از یک سند XSLT مطابق با نیاز های الگوریتم داده کاوی بازیابی می نماید. این مقاله مقایسه ای بین DMPML و سه برنامه کاربردی داده کاوی (Weka، RapidMiner، KNIME) را ارائه می دهد که رویکرد گراف جهت دار را با در نظر گرفتن زمان صرف شده جهت ایجاد و اجرای وظایف انتشار داده ها برای دو الگوریتم داده کاوی بکار می گیرد. آزمایشات با استفاده از انواع مختلف مجموعه های داده ای: عددی، قطعی و ترکیبی اجرا می شوند. ما مشاهده کردیم که طرح بکار رفته توسط DMPML می تواند استفاده از الگوریتم های مختلف داده کاوی را ساده کند و به طور قابل ملاحظه ای زمان صرف شده جهت ایجاد وظایف انتشار داده ها را کاهش دهد.

کلمات کلیدی:
انتشار داده ها، DMPML، XML، مقایسه ابزار ها

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/494060/