داده کاوی با الگوریتم های یادگیری ماشین

  • سال انتشار: 1400
  • محل انتشار: هشتمین کنگره ملی تازه های مهندسی برق و کامپیوتر ایران
  • کد COI اختصاصی: COMCONF08_196
  • زبان مقاله: فارسی
  • تعداد مشاهده: 134
دانلود فایل این مقاله

نویسندگان

زهرا سعدی

گروه مهندسی کامپیوتر، واحد ملایر، دانشگاه آزاد اسلامی، ملایر، ایران

چکیده

داده کاوی (Data Mining) علم استخراج الگوها، اطلاعات و تحلیل از مجموعه داده های خامی است که در یک سازمان و یا یک جامعه یا هر مجموعه دیگری تولید شده است. به جرات می توان گفت از زمانی که دانش داده کاوی و یا تحلیل داده پا به میدان گذاشت، ارزش داده در دنیای امروز متحول شد. سالیان پیش که حجم داده های تولیدی بسیار محدود بود، بسیاری از مدیران با نگاهی سطحی و با جداسازی دستی داده ها، می توانستند به مفاهیمی که در پس آن ها بود پی ببرند. اما زمانی که با حجم عظیمی از داده مواجه شویم، عملا این کار غیرممکن است و توان محدود هیچ انسانی، پاسخگوی تحلیل این داده ها و استخراج الگوهای آن نخواهد بود. اکنون علم داده کاوی بستری فراهم کرده است که بتوان با به کارگیری فناوری های جدیدی مانند یادگیری ماشین و… متناسب با اهداف مشخص، به دسته بندی، تحلیل و استخراج مفاهیم نهفته در داده ها پرداخت و از آنها برای اتخاذ تصمیمات مهم استفاده کرد. اما آنچه باعث شده علم داده کاوی تا این حد مورد توجه قرار بگیرد، ضریب اطمینان بالای تصمیمات اتخاذ شده بر اساس تحلیل های داده ای و نتایجی است که ایجاد می شود. زمانی که مدیران بر اساس احساسات و شهود اقدام به سیاست گذاری و تصمیم گیری در مورد موضوعی می کنند، احتمال خطا در تشخیص مشکل و ارائه راهکار بسیار زیاد است، در نتیجه ریسک زیادی منابع سازمان را تهدید می کند. درحالی که با تصمیم گیری بر اساس تحلیل های حاصل از داده کاوی، از هدررفت منابع شرکت در یک اقدام ناکارآمد و غیرضروری جلوگیری می شود. داده کاوی به مدیران کمک می کند تا پیش از هرچیزی، دید درستی از جامعه مورد بررسی پیدا کنند و پس از عارضه یابی درست، راهکاری بهینه برای حل آن مشکل ارائه دهند. در این مقاله، از مجموعه داده های بازاریابی بانکی از مخزن یادگیری ماشین استفاده شده است ۸۰ درصد داده ها آموزشی و ۲۰ درصد داده ها آزمایشی می باشند سپس با ایجاد مدل های دسته بندی با الگوریتم های داده کاوی و یادگاری ماشین مانند الگوریتم KNN و C۴.۵ در برنامه RapidMiner معیارهای دقت، صحت و اندازه گیری برای تست عملکرد مدل های دسته بندی مورد استفاده قرار گرفته است.

کلیدواژه ها

داده کاوی، بازاریابی، یادگیری ماشین، طبقه بندی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.