روشی مقاوم مبتنی بر بهینه سازی چند هدفه برای انتخاب ویژگی از دااده های ابعاد بالا به منظور دسته بندی اسناد
- سال انتشار: 1394
- محل انتشار: سومین کنفرانس بین المللی پژوهشهای کاربردی در مهندسی کامپیوتر و فن آوری اطلاعات
- کد COI اختصاصی: CITCONF03_248
- زبان مقاله: فارسی
- تعداد مشاهده: 624
نویسندگان
کارشناسی ارشد کامپیوتر نرمافزار دانشگاه علوم و تحقیقات واحد نیشابور ایران
استادیار گروه کامپیوتر دانشگاه آزاد اسلامی واحد مشهد ایران
چکیده
با توجه به اینکه دسته بندی اسناد منجر به بازیابی اطلاعات مناسب می شود ولی ابعاد بالای فضای ویژگی های یک چالش مهم در کارایی دسته بندی اسناد است این چالش موجب کاهش صحت و پیچیدگی بالای محاسبات در الگوریتم های یادگیری ماشین جهت دسته بندی اسناد می شود در این مقاله یک روش ترکیبی مبتنی بر تصفیه و پوشش مبتنی بر الگوریتم NSGAII جهت کاهش ابعاد با هدف حفظ دقت دسته بندی اسناد پیشنهاد داده ایم. سپس ویژگی های مازاد رااز مجموعه بهینه ویژگیها حذف نموده ایم. باتوجه به آزمایشات انجام شده بر روی مجموعه داده رویترز؛ میزان صحت روش پیشنهادی با استفاده از دسته بندی Naïve Bayes 0.906 و با استفاده از دسته بند 0.916 است و همچنین میزان مقاومت روش پیشنهادی 78 درصد می باشد.کلیدواژه ها
دسته بندی اسناد؛ انتخاب ویژگی؛ ورش ترکیبی؛ الگوریتم NSGAIIمقالات مرتبط جدید
- بررسی و شبیه سازی یک سوند الکترومکانیکی برای استفاده در عمل جراحی رفع انسداد مری
- پیاده سازی موفق ERP با بکارگیری چارچوب های COBIT و ITIL جهت برقراری امنیت و همگرایی کسب وکار در حوزه فناوری و اطلاعات سازمان های بزرگ
- Circuit design and experimental implementation of synchronization scheme between two identical unified chaotic systems
- Ischemia disease recognition in consecutive stress echocardiography using sparse representation based classifier
- تعیین حاشیه پایداری ولتاژ سیستم قدرت قبل از فروپاشی ولتاژ (سیستم مورد مطالعه: سیستم قدرت ۳ ماشینه و ۹ باسه (WSCC)
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.