استفاده از تکنیک رایگیری اکثریت در طبقه بندی اخبار جعلی از واقعی با الگوریتم های درخت تصمیم ،رگرسیون لجستیک و کا-نزدیک ترین همسایگی

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 114

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

STCONF06_302

تاریخ نمایه سازی: 7 شهریور 1402

چکیده مقاله:

برای طبقه بندی متن از یادگیری ماشین و پردازش زبان طبیعی به طور گستردهای استفاده می شود. به طور کلی هدف یک طبقه بند متن ، طبقه بندی سندها در قالب تعداد مشخصی از دسته های از پیش تعیین شده می باشد. در این پژوهش ، اخبار پخش شده در فضای مجازی مورد بررسی قرار گرفته است تا به این سوال پاسخ داده شود که این اخبار در کدام یک از دسته ی جعلی یا واقعی قرار می گیرد. روش پیشنهادی با در نظر داشتن ساختارکلمات انگلیسی ، مدل tf-idf و الگوریتم ها ی درخت تصمیم ،رگرسیون لجستیک و کا-نزدیک ترین همسایگی ، اخبار جعلی را از واقعی بااستفاده از تکنیک رایگیری اکثریت طبقه بندی می کند. در این پژوهش سه الگوریتم یادگیری مذکور مورد استفاده قرار گرفت تا یک مدل ترکیبی برای دسته بندی اخبار جعلی از واقعی ایجاد شود. مطابق نتایج و براساس شاخص های مختلف ازریابی دقت ، مدل پیشنهادی دقتی در حدود ۸۸ درصد داشت .

نویسندگان

هادی وظیفه آبان

دانشجوی کارشناسی ارشد دانشگاه جامع امام حسین (ع)

محمدرضا حسنی آهنگر

استادتمام دانشگاه جامع امام حسین (ع)