بهبود بکارگیری ابزار های داده کاوی جهت انتشار داده ها در مسائل دسته بندی با استفاده از ابزارهای داده کاوی
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 668
فایل این مقاله در 13 صفحه با فرمت PDF و WORD قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CITCOMP01_131
تاریخ نمایه سازی: 16 شهریور 1395
چکیده مقاله:
یکی از مراحل اساسی در فرآیند کشف دانش در پایگاه داده ها، فاز انتشار داده ها است. برای نتیجه گیری مناسب از یک داده کاوی، این فاز از اهمیت خاصی برخوردار است چرا که اگر داده ها به طور صحیح آماده نشده باشند، نتایج تمام فاز های بعدی فرآیند به خطر می افتند. DMPML چهارچوبی است که داده های از پیش پردازش شده را برای الگوریتم های مختلف داده کاوی در یک سند XML ذخیره می کند و کد گذاری صحیح را با استفاده از یک سند XSLT مطابق با نیاز های الگوریتم داده کاوی بازیابی می نماید. این مقاله مقایسه ای بین DMPML و سه برنامه کاربردی داده کاوی (Weka، RapidMiner، KNIME) را ارائه می دهد که رویکرد گراف جهت دار را با در نظر گرفتن زمان صرف شده جهت ایجاد و اجرای وظایف انتشار داده ها برای دو الگوریتم داده کاوی بکار می گیرد. آزمایشات با استفاده از انواع مختلف مجموعه های داده ای: عددی، قطعی و ترکیبی اجرا می شوند. ما مشاهده کردیم که طرح بکار رفته توسط DMPML می تواند استفاده از الگوریتم های مختلف داده کاوی را ساده کند و به طور قابل ملاحظه ای زمان صرف شده جهت ایجاد وظایف انتشار داده ها را کاهش دهد.
کلیدواژه ها:
نویسندگان
سمیه عبادی
دپارتمان مهندسی کامپیوتر، دانشگاه پیام نور، تهران
معزالدین حجت الاسلامی
دپارتمان مهندسی کامپیوتر، دانشگاه مالک اشتر ، تهران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :