رده بندی داده های جریانی به کمک سیستم های چند رده بند: بررسی چندین الگوریتم مطرح با مطالعه موردی بورس اوراق بهادار تهران

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 410

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

EMAA16_028

تاریخ نمایه سازی: 7 مهر 1398

چکیده مقاله:

پیشرفت های اخیر فناوری در زمینه پردازش و نگهداری اطلاعات، سبب شده است تا بسیاری از سازمان های بزرگ، روزانه و به صورت خودکار حجم انبوهی از داده ها را که به آنها داده های جریانی اطلاق می شود، با نرخ بسیاری بالائی تولید نمایند. اهمیت استخراج دانش از این حجم عظیم از داده ها و وجود چالش هائی از قبیل تغییر مفهوم، محدودیت حافظه، محدودیت پردازش و عدم امکان دسترسی مجدد به داده ها سبب شده است تا تحقیقات وسیعی در این زمینه صورت پذیرد. رویکردهای مختلفی برای رده بندی داده های جریانی مطرح شده اند که از این میان میتوان به رویکردهای مبتنی بر مجمع اشاره نمود. بیش از 60 الگوریتم مبتنی بر مجمع جهت رده بندی داده های جریانی وجود دارند که در این مقاله از میان آنها به پنج الگوریتم مطرح اشاره خواهد شد. در شبیه سازی صورت گرفته، دقت این الگوریتم ها با هم مقایسه شده اند. در این مطالعه، از داده های معاملات 280 شرکت پذیرفته شده در بورس اوراق بهادار تهران به همراه داده های مصنوعی استفاده شده است. نتا یج شبیه سازی نشان می دهد که دقت الگوریتم های بررسی شده، نزدیک به هم هستند، هر چند که این الگوریتم ها در رده بندی داده های بورس تهران، از دقت مناسبی برخودار نیستند.

کلیدواژه ها:

داده های جریانی ، رده بندی ، مجمع ، سیستم های چند رده بند

نویسندگان

مهدی محمدیان

مربی، دانشکده مهندسی کامپیوتر، دانشگاه پیام نور تهران ایران / دانشجوی مقطع دکتری، گرایش نرم افزار، دانشگاه علم و صنعت، تهران