ارزیابی یک تکنیک یادگیری ماشین ترکیبی موثر جدید در راستای بهبود عملکردتجزیه و تحلیل کلان داده

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 189

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CMTS03_008

تاریخ نمایه سازی: 14 شهریور 1402

چکیده مقاله:

برآورد می شود میانگین حجم داده تولید شده در روز بیش از ۲,۵ کوئینتیلیون ۲.۵×۱۰(۱۸) بایت باشد. به علاوه با توجه به گزارشات ارائه شده، تا سال ۲۰۲۰ ، در هر ثانیه ۱,۷۹ مگابایت داده توسط هر فرد در جهانتولید شده است. ظاهرا مجموعه دادههای بزرگ حاوی مقدار عظیمی از اطلاعات ارزشمند هستند که برایتصمیم گیری بهتر قابل استفاده است. با این حال پردازش کارآمد کلان داده به مقدار عجیبی از حافظه و منابعمحاسباتی نیاز دارد. الگوریتم های یادگیری ماشین، ابزارهای کارآمد و محبوبی هستند که برای تحلیل واستخراج دانش پنهان از مجموعه داده های بکار گرفته می شوند. با این حال برخی از این الگوریتم ها اساسا برای کار با مجموعه داده های کلان طراحی نشده بودند، بنابراین با افزایش حجم داده ها، پیچیدگی محاسباتی آنهانیز افزایش می یابد. در نتیجه این امر تحلیل کلان داده را بسیار کند یا غیرواقعی می کند. بنابراین نیاز بهروش های سریع و کارآمد برای تحلیل کلان داده مشهود است. این مقاله یک روش ترکیبی هوشمند یادگیریماشین مناسب برای تحلیل کلان داده معرفی می کند. این روش یک الگوریتم تشخیص مرز و انتخاب نمونه باالهام از تشخیص لبه در پردازش تصویر است. این الگوریتم با چهار الگوریتم یادگیری ماشین و مجموعه دادهکلان ارزیابی شد و نتایج نشان میدهد که به کاهش حافظه ذخیره سازی بیش از ۵۰ % دست یافته و همزمانسرعت آموزش الگوریتم یادگیری ماشین ارزیابی شده بدون تاثیر معنادار بر دقت پیش بینی، تا ۹۰ % (در برخیموارد) بهتر شده است.

نویسندگان

علیرضا نقوی

فارغ التحصیل رشته مهندسی کامپیوتر گرایش نرم افزار دانشگاه تبریز، تبریز، ایران