ارائه رویکرد تنسور سه بعدی برای طبقه بندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس
سال انتشار: 1400
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 277
فایل این مقاله در 30 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_STIM-7-4_009
تاریخ نمایه سازی: 28 فروردین 1401
چکیده مقاله:
هدف: هدف پژوهش حاضر اختصاص یکی از کلاس های جعل و واقعی به متن های آزاد می باشد. شبکه های عصبی کانولوشنی به عنوان یکی از مهم ترین مدل های یادگیری عمیق، دقت بالایی را بر روی این مسائل بدست آورده است. در این تحقیق آنالیز متن در سطح جمله و بهبود عملکرد شبکه عصبی کانولوشنی جهت تشخیص اخبار جعلی مورد توجه بوده است. در این شبکه ها کلمات به صورت کیسه ای از کلمات به مدل داده می شوند که هر کلمه با توجه به فضای برداری به ماتریس های دو بعدی تبدیل می شود. یکی از محدودیت های شبکه های کانولوشن این است که در سطح کلمه کار کرده و نمی تواند رابطه و فاصله بین جملات را در نظر بگیرد و آنالیز در سطح جمله مشکل اساسی در این تحقیق می باشد. در این پژوهش یک مدل پایه ای مبتنی بر شبکه های کانولوشنی پیشنهاد شده که در آن اسناد به صورت تنسورهای سه بعدی به شبکه داده می شوند تا بتواند مشکل مذکور را مرتفع نماید. در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم می آورد و به نتایج دقیق تری در تشخیص اخبار جعل دست می یابد.روش شناسی: پژوهش حاضر مطالعه ای کاربردی بوده که در آن حدود ۴۲۰۰۰ اخبار فارسی از شهرهای مختلف ایران از توییتر جمع آوری شده و با عمل پیش پردازش، داده های اضافی و غیر مفید حذف و پس از برچسب زدن متون پاک سازی شده، متن اخبار جهت رویکرد پیشنهادی با استفاده از نرم افزار پایتون پردازش شده اند.یافته ها: برخی از الگوریتم های یادگیری ماشین دارای قدرت بیشتری در مسائل طبقه بندی بودند، ولی با تغییراتی که در ساختار الگوریتم شبکه کانولوشن صورت گرفت، نتایج بهتری نسبت به الگوریتم های یادگیری ماشین و سایر الگوریتم های مشابه حاصل شد.نتیجه گیری: در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم می آورد و این مدل پیشنهادی در مقایسه با رویکردهای پیشنهادی در ادبیات، دقت قابل توجهی را بدست آورده است. مدل پیشنهادی بدون اضافه کردن سربار اضافی از لحاظ تعداد ویژگی ها و عمق شبکه، با تغییر در ورودی توانسته است به نتایج بهتر و قابل قبول از سایر رویکردهای موجود در ادبیات دست یافته و به دقت و صحت بیش از ۹۴ درصد دست یابد.
کلیدواژه ها:
پردازش زبان طبیعی ، طبقه بندی متن ، شبکه های عصبی کانولوشنی ، تنسور سه بعدی ، اخبار جعلی ، اخبار فارسی ، کرونا ویروس
نویسندگان
وحید متقی
دانشجوی دکتری، گروه مدیریت فناوری اطلاعات، واحد قشم، دانشگاه آزاد اسلامی، قشم، ایران.
مهدی اسماعیلی
استادیار، گروه علوم کامپیوتر، واحد کاشان، دانشگاه آزاد اسلامی، کاشان، ایران
قاسمعلی بازایی
استادیار، گروه مدیریت، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران.
محمدعلی افشارکاظمی
دانشیار، گروه مدیریت، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران.
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :