انتخاب ویژگی در داده های بزرگ با استفاده از برنامه نویسی CUDA

محمدعلی, صالح نیا; وحید, ستاری نائینی; مهدی, افتخاری

انتخاب ویژگی در داده های بزرگ با استفاده از برنامه نویسی CUDA

عنوان مقاله: انتخاب ویژگی در داده های بزرگ با استفاده از برنامه نویسی CUDA
شناسه ملی مقاله: ISCEE17_165
منتشر شده در هفدهمین کنفرانس ملی دانشجویی مهندسی برق ایران در سال 1393

مشخصات نویسندگان مقاله:

محمدعلی صالح نیا - دانشجوی کارشناسی ارشد، دانشگاه شهید باهنر کرمان،
وحید ستاری نائینی - استادیار ،بخش مهندسی کامپیوتر ،دانشگاه شهید باهنر کرمان
مهدی افتخاری - استادیار، بخش مهندسی کامپیوتر ،دانشگاه شهید باهنر کرمان

خلاصه مقاله:

انتخاب ویژگی توجه بسیاری از حوزه های تحقیقاتی در سال های اخیر بویژه در حوزه داده های با ابعاد بالا را به خود جلب کرده است . از آنجایی که تکنیک های سنتی در این زمینه کارایی کمتری برای کار با داده ها با ابعاد بزرگ دارند. در این مقاله که برای انتخاب ویژگی روی داده های بزرگ صورت گرفته است ، با بخش بندی ویژگی های مجموعه داده، و متناسب ساختن آنها با ابعاد واحد های کارت گرافیک و استفاده از یک الگوریتم ژنتیک ترکیبی موازی در هرکدام از این بخش ها، سرعت اجرای کار را بیشتر کرده ایم . موازی سازی این الگوریتم به روش پایه - پیرو صورت گرفته است و پیاده سازی آن روی کارت گرافیک انجام شده است که با استفاده از قدرت بالای کارت گرافیک در پردازش موازی داده ها توانسته ایم سرعت کار روش را به مقدار قابل توجه ای بالا ببریم . استفاده از کارت گرافیک به کمک زبان برنامه نویسی CUDA زمان اجرای الگوریتم را به حدود یک سوم کاهش می دهد. نتایج آزمایش ها که برروی ۸ مجموعه داده صورت گرفته است نشان می دهد که سرعت اجرای الگوریتم در حالت موازی سه برابر بیشتر از حالت سری الگوریتم می باشد.

کلمات کلیدی:

انتخاب ویژگی ، واحد های پردازش گرافیکی ((GPU، معماری دستگاه یکپارچه ی محاسباتی ((CUDA، الگوریتم ژنتیک موازی ،مدل پایه -پیرو

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1605057/