تولید یک مجموعه ی دادگان برای طبقه بندی سیاسی توییت های فارسی و کاربرد آن در پیشبینی گرایش سیاسی افراد

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 364

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECMECONF12_025

تاریخ نمایه سازی: 4 مرداد 1401

چکیده مقاله:

با ظهور وب ۲,۰، ارتباطات یک طرفه در اینترنت به ارتباطات دو طرفه تبدیل شده است که در آن کاربران میتوانند آزادانه درباره ی ایده ها، اخبار، محصولات، تصاویر، فیلمها و ... بحث کنند. درنتیجه، با فعالیت گسترده ی کاربران در فضای مجازی شاهد افزایش حجم و تنوع اطلاعات در دسترس هستیم، اما پاسخگویی به نیازهای اطلاعاتی جدید از میان این حجم زیاد از اطلاعات امری دشوار است. توییتر یکی از شبکه های اجتماعی فعال و نخبگانی در بستر وب میباشد که شامل منبعی غنی از اطلاعات است. جهت استخراج سریع دانش از میان این حجم عظیم اطلاعات یکی از روشها استفاده از مدلهای طبقه بندی خودکار است. تشخیص گرایش سیاسی یک توییت و یک شخص مسئله ای مهم و کاربردی است که در زبان فارسی تاکنون به آن پرداخته نشده است. در این پژوهش برآنیم که ابتدا با استفاده از روشهای جمع سپاری یک مجموعه ی داده ی مناسب برای این مسئله ی کاربردی تولید کنیم. در گام دوم قصد داریم با ارائه ی یک دستهبند خودکار، توییتها را در چهار گروه اصلاح طلب، اصول گرا، برانداز و سایر (یا بدون گرایش سیاسی) طبقه بندی کرده و در نهایت با ارائه روش مبتنی بر رایگیری جهتگیری یا گرایش سیاسی یک شخص را استخراج کنیم.

نویسندگان

مهدی دهقان

کارشناسی ارشد هوش مصنوعی، ربانیکز و رایانش شناختی از دانشگاه شهید بهشتی تهران

مهدی فخیمی کامران

دانشجوی دکتری شناخت اجتماعی و پژوهشگر علوم شناختی از دانشگاه شهید بهشتی تهران