بکارگیری مدل تحلیل احساسات در سطح حروف مبتنی بر شبکه عصبی روی نظرات فارسی ثبت شده در شبکه های اجتماعی و فروشگاه های اینترنتی

  • سال انتشار: 1401
  • محل انتشار: مجله محاسبات نرم، دوره: 11، شماره: 2
  • کد COI اختصاصی: JR_SCJKA-11-2_009
  • زبان مقاله: فارسی
  • تعداد مشاهده: 8
دانلود فایل این مقاله

نویسندگان

امید خلف بیگی

گروه مهندسی برق و کامپیوتر، دانشگاه خوارزمی ، تهران، ایران

سید علیرضا بشیری موسوی

گروه مهندسی برق و کامپیوتر، مرکز آموزش عالی فنی و مهندسی بوئین زهرا، قزوین، ایران

سینا قارلقی

گروه مهندسی برق و کامپیوتر، مرکز آموزش عالی فنی و مهندسی بوئین زهرا، قزوین، ایران

چکیده

امروزه با توجه به تمایل روزافزون مردم برای خرید اجناس از طریق فروشگاه های اینترنتی و شبکه های مجازی، شاهد افزایش داده های بدون ساختار مانند متن در سطح اینترنت هستیم. لذا پردازش متون و توسعه الگوریتم های کارآمد جهت استخراج دانش، توجه پژوهشگران حوزه علوم داده را در بسترهای مذکور به خود جلب کرده است. از رویکردهای پردازش متن می توان به دسته بندی جملات به گروه های احساسی متفاوت با استفاده از الگوریتم ها و روش های گوناگون اشاره کرد. در پژوهش حاضر، چارچوبی برای دسته بندی نظرات، مبتنی بر احساسات کاربران توسعه داده شده است که از پردازش در سطح حروف بهره می برد. از این رو در چارچوب پیشنهادی، از معماری تعبیه شده در مدل های زبانی استفاده شده است که لایه های چهارگانه تعبیه (جهت انتقال حروف به فضای برداری)، پیچش یک بعدی (جهت استخراج بردار ویژگی برای هر واژه)، نگاشت و شبکه عصبی بازگشتی را شامل می شود. در چارچوب پیشنهادی، ابتدا با بکارگیری لایه تعبیه در سطح حروف، برداری ثابت برای آنها تعیین می شود. سپس، مبتنی بر عملگرهای پیچش یک بعدی که به صورت موازی بکارگیری شده اند، ارتباط معنایی و منطقی بین حروف تشکیل دهنده هر واژه به دست آمده و بردار ۱۲۸ بعدی برای هر لغت، حاصل می شود. پس از دستیابی به بردارهای واژگان، با استفاده از دو معماری شبکه های عصبی بازگشتی، ارتباط بین واژگان کشف شده و احساس مرتبط با دیدگاه، تعیین می شود. نتایج حاصل از بکارگیری مدل پیشنهادی بر روی مجموعه نظرات مبتنی بر سنجه های Accuracy و F-score، به ترتیب ۷۹.۸۷% و ۷۹.۹۰% می باشد.

کلیدواژه ها

پردازش زبان طبیعی, تشخیص احساسات, مدل مبتنی بر محتوا, شبکه عصبی عمیق, بسترهای اینترنتی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.