شناسایی هرزنامه ها در پیامک های متنی با استفاده از مدل سازی موضوعی LDA و ماشین یادگیری شدید (ELM)

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 616

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICCONF03_036

تاریخ نمایه سازی: 2 تیر 1397

چکیده مقاله:

شناسایی هرزنامه ها یک کار مهم است که طی آن پیامک های هرز شناسایی و پالایش می شوند. تعداد زیادی پیامک هر روز ارسال می شود و برای یک کاربر به خاطر سپردن و ارتباط دادن پیامک های جدید با پیامک هایی که قبلا دریافت شده اند، بسیار دشوار است. در این مقاله، مساله شناسایی هرزنامه های پیامکی مورد بررسی قرار گرفته است و برای این منظور یک روش مبتنی بر انتخاب ویژگی با طبقه بندی ماشین یادگیری شدید (ELM) ارایه شده است. پس از انجام پیش پردازش های متنی کار در دو مرحله انجام شده است. در مرحله اول، ویژگی های بارز و بااهمیت با استفاده از یک روش مدل سازی موضوعی مبتنی بر LDA انتخاب می شوند. سپس، در مرحله دوم، روش طبقه بندی ELM برای دسته بندی پیامک ها به دو دسته، یعنی پیامک هرز و پیامک غیر هرز استفاده می شود. برای تجزیه و تحلیل، پارامترهای عملکرد مانند دقت، بازخوانی و سنجش F نیز ارزیابی می شوند. نتایج تجربی نشان می دهند که روش پیشنهادی در هر دو حالت مجموعه کامل ویژگی و حالت انتخاب ویژگی (LDA) بهتر از روش پایه عمل می کند.

کلیدواژه ها:

نویسندگان

سینا دامی

استادیار گروه کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران

محمد استرابی

دانشجوی کارشناسی ارشد IT، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران