تحلیل آماری اخبار جعلی فارسی مربوط به کوید-۱۹

سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 80

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_SOCG-5-4_004

تاریخ نمایه سازی: 5 اردیبهشت 1402

چکیده مقاله:

در این پژوهش تلاش می شود با استفاده از تحلیل آماری،ویژگی های اخبار جعلی فارسی مربوط به کوید-۱۹ بررسی گردد.برای این هدف،ابتدا یک پیکره زبانی که حاوی اخبار موثق و جعلی در حوزه کرونا است تهیه می شود.سپس الگوهای زبانی این دو دسته داده و همچنین دو تحلیل آماری مقدار اطلاعات و خوانایی اخبار موثق و جعلی مورد بررسی قرار گرفته و با یکدیگر مقایسه می شود.براساس اطلاعات استخراج شده و نتایج عملی به دست آمده از پیکره خبرهای جعلی،الگوهای زبانی مشترک بین این دو دسته داده وجود دارد.همچنین،مقدار اطلاعات در اخبار موثق براساس دو معیار آنتروپی و شگفتی بیشتر از اخبار جعلی است.همچنین سطح خوانایی خبرهای جعلی با استفاده از تساوی های اندازه گیری خوانایی متن مورد ارزیابی قرار گرفت و این نتیجه به دست آمد که اخبار جعلی در مقایسه با اخبار موثق عمدتا ساده بوده و دشوار نیست.در فرایند برچسب گذاری خودکار خبرهای موثق و جعلی براساس سطح دشواری حجم زیادی از اخبار جعلی ساده تشخیص داده شد.اگرچه سطح دشوار برای تعدادی خبر جعلی تشخیص داده شد،تعدادشان کمتر از اخبار موثق با سطح زبانی دشوار بود.علاوه بر این دستاورد و بررسی آماری ویژگی های زبانی براساس میزان اطلاعات و خوانایی اخبار جعلی،جنبه کاربردی این اطلاعات آماری جهت تشخیص خبر جعلی با استفاده از روش های یادگیری ماشینی مورد مطالعه قرار گرفت.

نویسندگان

مسعود قیومی

پژوهشکده زبان شناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی