استفاده از تکنیک رایگیری اکثریت در طبقه بندی اخبار جعلی از واقعی با الگوریتم های درخت تصمیم ،رگرسیون لجستیک و کا-نزدیک ترین همسایگی

هادی وظیفه آبان; محمدرضا حسنی آهنگر

استفاده از تکنیک رایگیری اکثریت در طبقه بندی اخبار جعلی از واقعی با الگوریتم های درخت تصمیم ،رگرسیون لجستیک و کا-نزدیک ترین همسایگی

محل انتشار: ششمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران

سال انتشار: 1402

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 278

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1744364

شناسه ملی سند علمی:

STCONF06_302

تاریخ نمایه سازی: 7 شهریور 1402

چکیده مقاله:

برای طبقه بندی متن از یادگیری ماشین و پردازش زبان طبیعی به طور گستردهای استفاده می شود. به طور کلی هدف یک طبقه بند متن ، طبقه بندی سندها در قالب تعداد مشخصی از دسته های از پیش تعیین شده می باشد. در این پژوهش ، اخبار پخش شده در فضای مجازی مورد بررسی قرار گرفته است تا به این سوال پاسخ داده شود که این اخبار در کدام یک از دسته ی جعلی یا واقعی قرار می گیرد. روش پیشنهادی با در نظر داشتن ساختارکلمات انگلیسی ، مدل tf-idf و الگوریتم ها ی درخت تصمیم ،رگرسیون لجستیک و کا-نزدیک ترین همسایگی ، اخبار جعلی را از واقعی بااستفاده از تکنیک رایگیری اکثریت طبقه بندی می کند. در این پژوهش سه الگوریتم یادگیری مذکور مورد استفاده قرار گرفت تا یک مدل ترکیبی برای دسته بندی اخبار جعلی از واقعی ایجاد شود. مطابق نتایج و براساس شاخص های مختلف ازریابی دقت ، مدل پیشنهادی دقتی در حدود ۸۸ درصد داشت .

کلیدواژه ها:

طبقه بندی متن ، اخبار جعلی ، پردازش زبان طبیعی ، متن انگلیسی ، رایگیری اکثریت

نویسندگان

هادی وظیفه آبان

دانشجوی کارشناسی ارشد دانشگاه جامع امام حسین (ع)

محمدرضا حسنی آهنگر

استادتمام دانشگاه جامع امام حسین (ع)