طراحی و تهیه دادگان برچسب خورده فارسی از اخبار مرتبط با همه گیری کووید-۱۹ به منظور تشخیص اخبار جعلی
محل انتشار: دوفصلنامه زبان و زبان شناسی، دوره: 19، شماره: 37
سال انتشار: 1402
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 117
فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_LSI-19-37_008
تاریخ نمایه سازی: 21 شهریور 1403
چکیده مقاله:
در این مقاله یک پیکره برچسب خورده، به منظور به کارگیری در تشخیص اخبار جعلی با حدود ۵۰۰۰ پست مربوط به اخبار همه گیری کووید-۱۹ از پیام رسان تلگرام استخراج شده و برچسب زنی می شود. فرایند ساخت پیکره در دو مرحله انجام می پذیرد. مرحله اول شامل جمع آوری و پیش پردازش داده ها و مرحله دوم شامل برچسب گذاری آنها می باشد. در مرحله اول، داده ها فیلتر می شوند و بعد از انجام پردازش های لازم برروی آنها، در مرحله دوم، بر اساس یک شیوه نامه، اقدام به برچسب گذاری می شود. در مرحله برچسب گذاری، از هفت عنوان موردنظر برای وظایف، استفاده می گردد و هر پست خبری با توجه به این هفت وظیفه برچسب گذاری می شود. ایجاد یک چهارچوب مناسب (شیوه نامه) برای برچسب زنی یکی از اقدامات مهم در این مرحله می باشد. شیوه نامه در اختیار دو برچسب زن خبره که بدین منظور آموزش دیده اند قرار می گیرد و اخبار از لحاظ هفت وظیفه ۱) صحیح یا جعلی بودن ۲) سیاسی بودن ۳) بالا بردن سطح آگاهی عمومی، دادن روحیه یا دادن یک توصیه به خواننده ۴) مطالب مربوط به دارو و درمان یا مراقبت های بهداشتی ۵) آمار مرگ و میر ۶) داشتن محتوای حاوی مطالب تنفرآمیز، سرزنش، عیب جویی، منفی بافی و ۷) ارزش داشتن برای بررسی واقعیت، مورد بررسی قرار گرفته و بر این اساس، برچسب درست، نادرست یا خنثی می گیرند. در صورت عدم توافق بین دو برچسب زن، از برچسب زن سوم نظرخواهی می شود. برچسب دهی اخبار طوری انجام می گیرد که در نهایت، دسته های متوازنی در وظیفه صحیح یا جعلی بودن اخبار به دست آید.
کلیدواژه ها:
نویسندگان
فروغ زاهد
گروه رایانه، دانشکده آمار، ریاضی و رایانه، دانشگاه علامه طباطبائی، تهران، ایران
محمد بحرانی
گروه رایانه، دانشکده آمار، ریاضی و رایانه، دانشگاه علامه طباطبائی، تهران، ایران
علیرضا منصوری
پژوهشگاه ارتباطات و فناوری اطلاعات، تهران، ایران