آشکارسازی خودکار طعنه در متون برخط فارسی با کمک الگوریتم های رده بندی
- سال انتشار: 1396
- محل انتشار: چهارمین کنفرانس ملی فناوری اطلاعات، کامپیوتر و مخابرات
- کد COI اختصاصی: ITCT04_286
- زبان مقاله: فارسی
- تعداد مشاهده: 948
نویسندگان
دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد دولت آباد
عضو هییت علمی دانشگاه شهرکرد
باشگاه پژوهشگران جوان و نخبگان، واحد دولت آباد، دانشگاه آزاد اسلامی، اصفهان، ایران
چکیده
استفاده گسترده از وب برای ابراز نظر و عقیده افراد باعث ایجاد حوزه مطالعاتی به نام نظرکاوی شده است؛هدف اصلی این حوزه آشکارسازی نظرات مثبت و منفی نهفته در متن است یکی از زیرمجموعههای نظرکاوی، طعنه کاوی است. در طعنه کاوی نیز نظرات مثبت و منفی به شکل معکوس ابراز میشوند. هدفاین مقاله ارایه یک مدل با الگوریتمهای ردهبندی برای آشکارسازی طعنه است؛ که متن را به عنوان طعنه آمیز یا غیر طعنهآمیز ردهبندی میکند. تاکنون مطالعات مختلفی غالبا برای زبان انگلیسی بر روی مسیله ردهبندیمتن طعنهآمیز یا غیر طعنهآمیز انجام شده است؛ اما تاکنون تحقیقی روی زبان فارسی در این حوزه گزارش نشده است. در این مقاله، مدلی مبتنی بر یادگیری ماشین برای ردهبندی متن طعنهدار و بدون طعنه ارایهمیشود و برای یافتن بهترین الگوریتمهای ردهبندی، روش نایوبیز، ماشین بردار پشتیبان، درخت تصمیم، رگرسیون لجستیک در مدل پیشنهادی آزمایش میشود. برای این کار یک مجموعه داده شامل 1320 توییتفارسی از سایت توییتر جمعآوریشده است. طبق نتایج آزمایشات، بهترین الگوریتم ردهبندی با بالاترین درستی برای مدل پیشنهادی، الگوریتم ردهبندی نایوبیز بدست آمد. این الگوریتم و روش انتخاب ویژگی تکرار واژه بر روی این مجموعه داده، درستی91/06 درصد را به دست آورد.کلیدواژه ها
الگوریتم های رده بندی، متون فارسی، طعنه کاوی، آشکارسازی خودکار، نظر کاویمقالات مرتبط جدید
- tGraph_PheroWalk : یک الگوریتم جدید برای یادگیری بازنمایی گراف های پویا
- Efficient Triple Modular Redundancy for Reliability Enhancement of DNNs Using Explainable AI
- مقایسه فناوری CMUT با پیزوالکتریک برای کاربرد در تصویربرداری التراسونیک
- بهبود کنترل دست رباتیک به کمک کنترل کننده تطبیقی فازی-PID
- طراحی و شبیه سازی آنتن تک قطبی چند بانده فشرده با تغذیه ریز نوار برای بهبود عملکرد در باندهای فرکانسی ۲.۵، ۳.۸، ۵.۴ و ۶.۹ گیگاهرتز
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.