بهبود ترکیب نمونه انتخاب برای انتساب داده های گمشده با کمک الگوریتم های ماشین بردار پشتیبان وجستجوی گرانشی
- سال انتشار: 1396
- محل انتشار: دومین کنفرانس ملی مهندسی برق و کامپیوتر
- کد COI اختصاصی: ELCM02_146
- زبان مقاله: فارسی
- تعداد مشاهده: 597
نویسندگان
هنرآموز رایانه استان کرمان ناحیه ۲ دانشگاه غیرانتفاعی بهمنیارکرمان
هنرآموز رایانه استان سمنان شهرستان دامغان دانشگاه آزاد اسلامی علوم و تحقیقات واحد سمنان
چکیده
گمشد ه گی داده در تمامی پژوهش های علوم اجتماعی، رفتاری، پزشکی وجود دارد. در آمار ،گم شدن داده به وضعیتی گفته می شود که تعدادی از اطلاعات داده ها گزارش نشده باشند. گمشده گی داده باعث کاهش تطابق جامعه نمونه با جامعه کل شده و می تواند منجر به نتیجه گیری اشتباه در مورد جمعیت اصلی شود. گمشده گی داده یک اتفاق معمول بوده و بسته به میزان آن، می تواند اثر قابل توجهی در نتیجه گیری به دست آمده از داده ها داشته باشد. تمامی روش های برآورد پارامترها بر پایه فرض کامل بودن مجموعه داده ها استوار است و تحت برقراری این شرایط منجر به برآوردهایی نااریب می شوند؛ و البته با افزایش نسبت گمشدگی، مقدار اریبی نیز افزایش خواهد یافت.در این پژوهش بدین صورت عمل گردیده است که یک سری مجموعه داده واقعی بر حسب درصد گمشده گی مقادیری را از دست می دهند سپس بر اساس الگوریتم جستجوی گرانشی مقادیر گمشده تخمین زده می شوند وبر اساس معیارمیانگین خطای مطلق میزان درصد خطای بدست آمده از روش جستجوی گرانشی نسبت به مقادیر واقعی محاسبه می شود که این معیار بر اساس نتایج ارزیابی ، خطای کمتری را نشان میدهد و هر چه داده ها بیشتر باشند این معیار نیز به تناسب بیشتر می شود.سپس با استفاده از الگوریتم طبقه بندی svm برای طبقه بندی داده ها بر اساس مقادیر تعیین شده توسط الگوریتم جستجوی گرانشی دقت حاصل با دقت طبقه بندی بر روی داده های حاصل ازپر کردن با میانگین ویژگی وهمچنین پرکردن داده ها با الگوریتم نزدیکترین همسایگی (K-NN) مقایسه می گردد.که در بخش ارزیابی نتایج نشان داده می شود که دقت طبقه بندی بر روی داده های بدست آمده از روش جستجوی گرانشی نسبت به روش های دیگر بالاتر است و هرچه درصد گمشدگی بیشتر شود این دقت کمتر می شود.کلیدواژه ها
داده های گمشده، جستجوی گرانشی،داده کاوی، الگوریتم طبقه بندی svm، دقت طبقه بندیمقالات مرتبط جدید
- بهینه سازی مدیریت انرژی در ریزشبکه ها با استفاده از الگوریتم های هوش مصنوعی
- مبانی، کاربردها و چالشهای یادگیری مشارکتی و تحلیل تجربی و مقایسه ابزارهای یادگیری فدرالی در پیاده سازی مدلهای یادگیری ماشین
- راهکارهای مبتنی بر هوش مصنوعی برای بهره وری انرژی در تولید سیمان: یک بررسی جامع
- معماری اینترنت اشیا مبتنی بر هوش مصنوعی در مدیریت انرژی هوشمند
- سیستم های EMS/BMS در ساختمان های ZEB و نمونههای اجرا شده آن در سطح جهانی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.