مدل سازی موضوعی متنی بر روی ریز نوشته های رسانه های اجتماعی فارسی
سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 32
فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_ABMIR-2-2_012
تاریخ نمایه سازی: 13 خرداد 1404
چکیده مقاله:
ظهور رسانه های اجتماعی فرصت های فزاینده ای برای اشتراک افکار کاربران فراهم می کنند. روزانه میلیاردها ریزنوشته در رسانه های اجتماعی تولید می شود که تحلیل آن ها در حوزه متن کاوی و تحلیل محتوا امری ضروری است. استخراج موضوعات دقیق از ریزنوشته ها در مقیاس بزرگ کاری مهم و چالش برانگیز است. مطالعات اندکی در زمینه تشخیص موضوع در ریزنوشته های فارسی انجام شده است و الگوریتم های موجود قابل توجه نیستند. ازاین رو بر آن شدیم در حوزه تشخیص موضوع در زبان فارسی به مطالعه بپردازیم. مدل سازی موضوعی از روش های تشخیص موضوع است که گروه هایی از کلمات را به عنوان موضوع از اسناد استخراج می کنند. اخیرا مدل های موضوع عصبی بهبودهایی برای افزایش انسجام مدل سازی موضوعی نشان داده است. همچنین، تعبیه های متنی مدل های عصبی را ارتقا داده اند. بدین سبب، در این تحقیق دو مدل موضوعی متنی ترکیبی و مدل موضوعی متنی ZeroShot برای استخراج موضوع در ریزنوشته های شبکه های اجتماعی فارسی ارائه شده است. این دو مدل بازنمایی متنی از پیش آموزش دیده شده BERT فارسی را در مدل های موضوع عصبی گنجانده اند. نتایج آزمایش ها نشان می دهد که این دو روش نسبت به روش های مورد مقایسه با بالاترین مقدار F۱-Measure ، تنوع موضوع و امتیاز انسجام بالا بهترین عملکرد را از خود نشان می دهند. همچنین مدل موضوعی متنی ZeroShot نسبت به مدل موضوعی متنی ترکیبی نتایج بهتری از لحاظ معیارهای ارزیابی داشته است.
کلیدواژه ها:
نویسندگان
زینب متقی نیا
دانشجوی دکتری، آزمایشگاه سیستم های پردازش هوشمند رایانه ای، گروه مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران
محمدرضا فیضی درخشی
استاد، آزمایشگاه سیستم های پردازش هوشمند رایانه ای، گروه مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :