تاثیر کاهش تعداد خصیصه و دسته بند در مساله فیلترینگ هرزنامه بر پارامتر کارایی

  • سال انتشار: 1393
  • محل انتشار: دومین همایش ملی پژوهش های کاربردی در علوم کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: CITCONF02_440
  • زبان مقاله: فارسی
  • تعداد مشاهده: 479
دانلود فایل این مقاله

نویسندگان

رضوان یوسفی حاجی اباد

دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی اهواز

سیدجواد میر عابدینی

استادیار گروه کامپیوتر، دانشگاه آزاد اسلامی تهران

علی هارون ابادی

استادیار گروه کامپیوتر، دانشگاه آزاد اسلامی تهران

چکیده

انتخاب خصیصه یکی از چالش های مهم در مسائل مربوط به دسته بندی متون برای حذف خصیصه های غیرمفید است که هدف آن بهبود کارایی دسته بندی است. شاخص گذاری معنایی نهفته یکی از روش هایی است که به کشف روابط معنایی بین ویژگی ها می پردازد. در این مقاله تأثیر یک روش ترکیبی جهت انتخاب خصیصه های مؤثر با استفاده از روش شاخص گذاری نهفته در مسئله فیلتر کردن هرزنامه و همچنین بسته بندی IBK از دسته -K نزدیک ترین همسایه به منظور بالا بردن دقت و کارایی سیستم بررسی می شود. روش انتخاب خصیصه ای پیشنهادی با استفاده از دستبند مذکور بر روی مجموعه داده Ling spam کارایی 99.9درصدی را نشان می دهد.

کلیدواژه ها

فیلتر کردن هرزنامه، انتخاب خسیس، شاخص گذاری معنایی نهفته، روابط معنایی،دسته بند IBK

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.