خوشه بندی با استفاده از انتخاب زیرمجموعه ویژگی خودکار و تعیین تعداد خوشه های تطبیقی
- سال انتشار: 1398
- محل انتشار: پنجمین کنفرانس ملی محاسبات توزیعی و پردازش داده های بزرگ
- کد COI اختصاصی: DCBDP05_009
- زبان مقاله: فارسی
- تعداد مشاهده: 826
نویسندگان
استادیار دانشکده ریاضی، دانشگاه تبریز، دانشکده علوم ریاضی، گروه علوم کامپیوتر
دانشجوی کارشناسی ارشد،، موسسه آموزش عالی دانشوران تبریز، دانشکده کامپیوتر و فناوری اطلاعات
چکیده
حجم و سرعت و تنوع داده های تولیدی توسط آزمایشها علمی و تجربی، به صورت چشمگیری در حال افزایش است. استخراج دانش نهفته در این نوع از داده های که به داده های عظیم مشهور است، با استفاده از روشهای سنتی داده کاوی از دقت کافی برخوردار نیست و نیاز به روشهای جدید احساس میشود. خوشه بندی داده های بزرگ یکی از محبوب ترین روشهایی است که باهدف تقسیم یک گروه از نمونه داده های بدون برچسب در زیرگروه (خوشه)، به طوریکه نمونه های داده متعلق به یک خوشه شبیه به یکدیگر و به نمونه داده های متعلق به خوشه های دیگر غیرمشابه باشند، ارائه شده است. در این تحقیق برای غلبه بر مشکلات خوشه بندی داده های بزرگ روش جدیدی پیشنهادشده است که از انتخاب زیرمجموعه ای از ویژگیها بر اساس انحراف معیار داده های عددی و پراکندگی در داده های ترتیبی بهره میبرد. صفتهای عددی که دارای انحراف معیار کمی هستند از توزیع نامتوازنی برخوردارند و تاثیر چندانی در تعیین گروه داده ها ندارند. همچنین ویژگیهای ترتیبی با پراکندگی کم داده ها باعث میشود که بیشتر نمونه ها در گروه یکسانی قرار گیرند که دقت خوشه بندی را کاهش میدهد. نتایج آزمایشها نشان داده است روش پیشنهادی دقتی در حدود %95 برای خوشه بندی مجموعه داده های بزرگ داشته و با روشهای پیشین معرفی شده در نشریات قابل مقایسه هست.کلیدواژه ها
داده کاوی، خوشه بندی، انتخاب زیرمجموعه ویژگی خودکار، خوشه بندی تطبیقیمقالات مرتبط جدید
- مرور سیستماتیک کاربرد هوش مصنوعی در موسیقی
- In-silico Analyses for Finding Potential Key Genes and Pathways Associated with Guillain-Barré Syndrome Using Computational Tools
- OCD Severity Based on EEG Signals
- Investigating the (non) -Impact of Customizing Knowledge Bases of Artificial Intelligence -Driven Robot on Language for Specific Purposes Learning
- The Need for Telehealth and Tele-Educationon in Optimizing Measles Surveillance and Reducing Healthcare Costs
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.