بهبود بکارگیری ابزار های داده کاوی جهت انتشار داده ها در مسائل دسته بندی با استفاده از ابزارهای داده کاوی

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 668

فایل این مقاله در 13 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CITCOMP01_131

تاریخ نمایه سازی: 16 شهریور 1395

چکیده مقاله:

یکی از مراحل اساسی در فرآیند کشف دانش در پایگاه داده ها، فاز انتشار داده ها است. برای نتیجه گیری مناسب از یک داده کاوی، این فاز از اهمیت خاصی برخوردار است چرا که اگر داده ها به طور صحیح آماده نشده باشند، نتایج تمام فاز های بعدی فرآیند به خطر می افتند. DMPML چهارچوبی است که داده های از پیش پردازش شده را برای الگوریتم های مختلف داده کاوی در یک سند XML ذخیره می کند و کد گذاری صحیح را با استفاده از یک سند XSLT مطابق با نیاز های الگوریتم داده کاوی بازیابی می نماید. این مقاله مقایسه ای بین DMPML و سه برنامه کاربردی داده کاوی (Weka، RapidMiner، KNIME) را ارائه می دهد که رویکرد گراف جهت دار را با در نظر گرفتن زمان صرف شده جهت ایجاد و اجرای وظایف انتشار داده ها برای دو الگوریتم داده کاوی بکار می گیرد. آزمایشات با استفاده از انواع مختلف مجموعه های داده ای: عددی، قطعی و ترکیبی اجرا می شوند. ما مشاهده کردیم که طرح بکار رفته توسط DMPML می تواند استفاده از الگوریتم های مختلف داده کاوی را ساده کند و به طور قابل ملاحظه ای زمان صرف شده جهت ایجاد وظایف انتشار داده ها را کاهش دهد.

نویسندگان

سمیه عبادی

دپارتمان مهندسی کامپیوتر، دانشگاه پیام نور، تهران

معزالدین حجت الاسلامی

دپارتمان مهندسی کامپیوتر، دانشگاه مالک اشتر ، تهران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • J. Han and M Kamber, Data Mining: Concepts and Techniques, ...
  • D. Pyle, :Data collection, preparation, quality, and visualization, in The ...
  • M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann, ...
  • I. Mierswa, M. Wurst, R. Klinkenberg, M. Scholz, and T. ...
  • _ Knowledge Discovery and Data Mining, Ser. KDD _ NewYork, ...
  • M. R. Berthold, N. Cebron, F. Dill, T. R. Gabriel, ...
  • Learning and Applications, ser. Studies in Classification, Data Analysis, and ...
  • H.-Y. Lo, C.-M. Chang, T.-H. Chiang, C.-Y. Hsiao, A. Huang, ...
  • M. Kay, _ trans formations (xslt) version _ January 2007. ...
  • P. M. Gonc, alves, Jr. and R. S. M. Barros, ...
  • W. Du, and R. Lee, Eds. Los Alamitos, CA, USA: ...
  • _ E. Frank, M. Hall, G. Holmes, R. Kirkby, B. ...
  • M. R. Berthold, N. Cebron, F. Dill, T. R. Gabriel, ...
  • A. Frank and A Asuncion, :UCI machine learning repository, " ...
  • S. Haykin, Neural Networks and Learning Machine, 3rd ed. New ...
  • J. R. Quinlan, :Induction of decision trees, Machine Learning, vol. ...
  • I. H. Witten and E Frank, Data Mining: Practical Machine ...
  • M. Kay, _ SaXOn xslt and xquery processor." 2010. [Online]. ...
  • نمایش کامل مراجع