CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

رده بندی داده های جریانی به کمک سیستم های چند رده بند: بررسی چندین الگوریتم مطرح با مطالعه موردی بورس اوراق بهادار تهران

عنوان مقاله: رده بندی داده های جریانی به کمک سیستم های چند رده بند: بررسی چندین الگوریتم مطرح با مطالعه موردی بورس اوراق بهادار تهران
شناسه ملی مقاله: EMAA16_028
منتشر شده در شانزدهمین همایش ملی پژوهش های نوین در علوم و فناوری در سال 1397
مشخصات نویسندگان مقاله:

مهدی محمدیان - مربی، دانشکده مهندسی کامپیوتر، دانشگاه پیام نور تهران ایران / دانشجوی مقطع دکتری، گرایش نرم افزار، دانشگاه علم و صنعت، تهران

خلاصه مقاله:
پیشرفت های اخیر فناوری در زمینه پردازش و نگهداری اطلاعات، سبب شده است تا بسیاری از سازمان های بزرگ، روزانه و به صورت خودکار حجم انبوهی از داده ها را که به آنها داده های جریانی اطلاق می شود، با نرخ بسیاری بالائی تولید نمایند. اهمیت استخراج دانش از این حجم عظیم از داده ها و وجود چالش هائی از قبیل تغییر مفهوم، محدودیت حافظه، محدودیت پردازش و عدم امکان دسترسی مجدد به داده ها سبب شده است تا تحقیقات وسیعی در این زمینه صورت پذیرد. رویکردهای مختلفی برای رده بندی داده های جریانی مطرح شده اند که از این میان میتوان به رویکردهای مبتنی بر مجمع اشاره نمود. بیش از 60 الگوریتم مبتنی بر مجمع جهت رده بندی داده های جریانی وجود دارند که در این مقاله از میان آنها به پنج الگوریتم مطرح اشاره خواهد شد. در شبیه سازی صورت گرفته، دقت این الگوریتم ها با هم مقایسه شده اند. در این مطالعه، از داده های معاملات 280 شرکت پذیرفته شده در بورس اوراق بهادار تهران به همراه داده های مصنوعی استفاده شده است. نتا یج شبیه سازی نشان می دهد که دقت الگوریتم های بررسی شده، نزدیک به هم هستند، هر چند که این الگوریتم ها در رده بندی داده های بورس تهران، از دقت مناسبی برخودار نیستند.

کلمات کلیدی:
داده های جریانی، رده بندی، مجمع، سیستم های چند رده بند

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/932731/