تشخیص اخبار جعلی با رویکرد ترکیبی مبتنی بر رگرسیون لجستیک و ماشین بردار پشتیبان با بهره گیری از ویژگی های متنی و آماری
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 74
فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCAEC07_080
تاریخ نمایه سازی: 17 خرداد 1405
چکیده مقاله:
با گسترش شبکه های اجتماعی و رسانه های آنلاین انتشار اخبار جعلی به یکی از چالش های مهم عصر دیجیتال تبدیل شده است. این پدیده علاوه بر ایجاد اختلال در دسترسی به اطلاعات صحیح می تواند پیامدهای اجتماعی و سیاسی گسترده ای به همراه داشته باشد. در این پژوهش یک مدل ترکیبی مبتنی بر رگرسیون لجستیک و ماشین بردار پشتیبان با رویکرد ترکیبی برای شناسایی اخبار جعلی ارائه شده است. داده های مورد استفاده از پایگاه کگل و شامل بیش از ۷۲ هزار نمونه خبر واقعی و جعلی گردآوری شد. پس از پیش پردازش شامل پاکسازی، متن نرمال سازی و ریشه یابی، ویژگی های متنی با استفاده از روش TF-IDF استخراج و برخی ویژگی های آماری مانند طول جملات و تعداد واژگان به داده ها افزوده شد. این ترکیب از ویژگی ها ورودی غنی تری برای مدل فراهم آورد. نتایج ارزیابی نشان داد که مدل پیشنهادی به دقت برابر با ۰.۹۶ درصد، امتیاز ۱ F برابر با ۰.۹۶ درصد و مقدار AUC معادل ۰.۹۹ دست یافته است. همچنین تحلیل ماتریس اغتشاش و منحنی ROC نشان داد که مدل توانسته است با حداقل خطا در شناسایی اخبار واقعی و جعلی عمل کند و عملکردی متوازن در هر دو کلاس ارائه دهد. این یافته ها نشان می دهد که استفاده از ترکیب الگوریتم های یادگیری ماشین در قالب ترکیبی همراه با بهره گیری از ویژگی های متنی و آماری می تواند راهکاری موثر برای مقابله با انتشار اخبار جعلی در فضای مجازی باشد.
کلیدواژه ها:
نویسندگان
امیرحسین صلاح منش
کارشناسی ارشد کامپیوتر گرایش رایانش،امن دانشگاه بین المللی امام رضا،ایران