بهبود تشخیص پیام های کوتاه مزاحم با ارائه یک روش ترکیبی مبتنی بر ویژگی های سبک نگارش متن و جنگل مسیر بهینه

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 461

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSCG03_178

تاریخ نمایه سازی: 14 فروردین 1399

چکیده مقاله:

افزایش روز افزون محبوبیت سرویس پیام کوتاه، بستری مناسب برای انتشار پیشنهادهای تبلیغاتی و دیگر پیام های ناخواسته ایجاد کرده است. این پیام های ناخواسته بعضا موجب نارضایتی کاربران می شود. لذا یافتن راهکاری برای حل این مشکل از زمینه های پژوهشی مورد توجه محققان است. اکثر روش های ارائه شده در زمینه تشخیص اسپم از دو مشکل سرعت پایین آموزش الگوریتم دسته بندی و یا دقت پایین دسته بندی رنج می برند. بنابراین در پژوهش حاضر از ترکیب الگوریتم جنگل مسیر بهینه 1 و ویژگی های سبک نگارش متن برای برای بهبود سرعت و دقت تشخیص اسپم در پیام کوتاه استفاده شده است. در این پژوهش از دو مجموعه داده SMSSpamCollection_v.1 و SpamSMSData-master برای انجام آزمایش ها بهره برده شده است. در آزمایش های انجام شده دقت بدست آمده در تشخیص پیام های اسپم و غیراسپم به طور میانگین برابر 99.05 درصد و 90.66 درصد می باشد. این مقدار در مقایسه با سایر روش ها، دارای حداقل بهبود 2.5 درصدی در هر دو معیار بوده است. همچنین آزمایش ها نشان داد که زمان آموزش روش پیشنهادی سری عتر از روش های پیشین می باشد.

کلیدواژه ها:

تشخیص اسپم ، الگوریتم OPF ، ویژگی های سبک نگارش ، پیام کوتاه

نویسندگان

مسیح زعمری

دانشجوی مقطع دکتری، اصفهان – دانشگاه اصفهان

محمد توکلی

دانش آموخته کارشناسی ارشد، اصفهان – دانشگاه آزاد اسلامی واحد نجف آباد

مهدی باطنی

استادیار، اصفهان – دانشگاه شیخ بهائی