روش شناسی مجموعه درختان تصمیم گیری مبتنی بر داده هوشمند برای داده های بزرگ نامتعادل

سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 13

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECME23_007

تاریخ نمایه سازی: 28 مهر 1403

چکیده مقاله:

تفاوت در اندازه داده ها در هر کلاس، که به نام توزیع نامتعادل داده نیز شناخته می شود، به یک مشکل رایج در داده ها تبدیل شده است .کیفیت. سناریوهای کلان داده چالش جدیدی را برای الگوریتم های طبقه بندی نامتعادل سنتی ایجاد می کنند، زیرا آنها آماده نیستند.برای کار با چنین حجمی از داده ها استراتژی های تقسیم داده ها و کمبود داده در کلاس اقلیت به دلیل استفاده از MapReduce پارادایم چالش های جدیدی را برای مقابله با عدم تعادل بین کلاس ها در سناریوهای کلان داده مطرح کرده است. گروه ها بوده اند.نشان داده شده است که می تواند با موفقیت به مشکلات داده های نامتعادل رسیدگی کند. داده های هوشمند به داده هایی با کیفیت کافی برای دستیابی اشاره دارد.مدل های با کارایی بالا ترکیبی از مجموعه ها و داده های هوشمند، که از طریق پیش پردازش داده های بزرگ به دست می آید، باید یک هم افزایی عالی باشد در این مقاله، ما یک روش جدید مجموعه درخت های تصمیم مبتنی بر داده هوشمند را برای پرداختن پیشنهاد می کنیم .مشکل طبقه بندی نامتعادل در حوزه های کلان داده، یعنی روش SD_DeTE. این متدولوژی مبتنی بریادگیری درخت های تصمیم گیری مختلف با استفاده از داده های کیفیت توزیع شده برای فرآیند مجموعه. این داده های با کیفیت به دست می آید.با ادغام گسسته سازی تصادفی، تجزیه و تحلیل مولفه های اصلی، و نمونه برداری تصادفی بیش از حد مبتنی بر خوشه برای به دست آوردن نسخه های مختلف Smart Data از داده های اصلی. آزمایش های انجام شده در ۲۱ مجموعه داده باینری اقتباس شده نشان داده است که ما روش شناسی از جنگل تصادفی بهتر عمل می کند.

کلیدواژه ها:

کلان داده • داده های هوشمند • طبقه بندی • مجموعه • داده های نامتعادل • درخت تصمیم

نویسندگان

عاطفه خسروی

۱-گروه کامپیوتر دانشکده ی فنی و مهندسی ،واحد فلق،دانشگاه آزاد اسلامی ،اراک ،ایران

زینب خسروی

۲-دبیر هنرستان ،خرم آباد ،ایران