شناسایی هرزنامه ها در پیامک های متنی با استفاده از مدل سازی موضوعی LDA و ماشین یادگیری شدید (ELM)

سینا دامی; محمد استرابی

شناسایی هرزنامه ها در پیامک های متنی با استفاده از مدل سازی موضوعی LDA و ماشین یادگیری شدید (ELM)

محل انتشار: سومین کنفرانس ملی نوآوری و تحقیق در مهندسی برق و مهندسی کامپیوتر و مکانیک ایران

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 996

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/741133

شناسه ملی سند علمی:

ICCONF03_036

تاریخ نمایه سازی: 2 تیر 1397

چکیده مقاله:

شناسایی هرزنامه ها یک کار مهم است که طی آن پیامک های هرز شناسایی و پالایش می شوند. تعداد زیادی پیامک هر روز ارسال می شود و برای یک کاربر به خاطر سپردن و ارتباط دادن پیامک های جدید با پیامک هایی که قبلا دریافت شده اند، بسیار دشوار است. در این مقاله، مساله شناسایی هرزنامه های پیامکی مورد بررسی قرار گرفته است و برای این منظور یک روش مبتنی بر انتخاب ویژگی با طبقه بندی ماشین یادگیری شدید (ELM) ارایه شده است. پس از انجام پیش پردازش های متنی کار در دو مرحله انجام شده است. در مرحله اول، ویژگی های بارز و بااهمیت با استفاده از یک روش مدل سازی موضوعی مبتنی بر LDA انتخاب می شوند. سپس، در مرحله دوم، روش طبقه بندی ELM برای دسته بندی پیامک ها به دو دسته، یعنی پیامک هرز و پیامک غیر هرز استفاده می شود. برای تجزیه و تحلیل، پارامترهای عملکرد مانند دقت، بازخوانی و سنجش F نیز ارزیابی می شوند. نتایج تجربی نشان می دهند که روش پیشنهادی در هر دو حالت مجموعه کامل ویژگی و حالت انتخاب ویژگی (LDA) بهتر از روش پایه عمل می کند.

کلیدواژه ها:

طبقه یندی پیامک ، شناسایی هرزنامه ، مدل سازی موضوعی ، LDA ، ماشین یادگیری شدید (ELM)

نویسندگان

سینا دامی

استادیار گروه کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران

محمد استرابی

دانشجوی کارشناسی ارشد IT، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران