ارایه یک الگوریتم کارامد جهت تعیین جنسیت نویسنده درزبان فارسی بااستفاده ازروشهای هوشمند

  • سال انتشار: 1396
  • محل انتشار: سومین کنفرانس سراسری مهندسی برق، کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: ECIE03_016
  • زبان مقاله: فارسی
  • تعداد مشاهده: 561
دانلود فایل این مقاله

نویسندگان

مهرداد کشاورزی

عباس کوچاری

آراش شریفی

چکیده

امروزه گسترش فضای مجازی و متعاقب آن فعالیت بیشتر افراد و رفع اکثر نیازهای روزمره خود از این فضا به حد قابل توجهی گسترش یافته است. این موضوع در حالیست که اکثر کاربران این فضا میتوانند با مخفی نگهداشتن شخصیت حقیقی خود اقدام به فعالیت نمایند. راهکارهای شناسایی جنسیت افراد از روی متنهای منتشر شده در فضای مجازی عمدتا بر اساس معیارهای زبانشناسی است. استفاده از این راهکار علاوه بر تعیین هویت افراد می تواند در بازاریابی برخط نیز بسیار موثر باشد چراکه بر اساس آن میتوان روحیات افراد را بر اساس جنسیت شناخت و تبلیغات هدفمندی در این رابطه انجام داد. در این مقاله با توجه به ساختار و نگارش زبان فارسی که دارای ویژگیهای بسیاری است توانستیم الگوریتم کارآمدی که بر اساس روشهای یادگیری ماشین بنا نهاده شده است را ارایه دهیم. در این الگوریتم با استفاده از الگوریتم ژنتیک ویژگی برتر متون را استخراج نمودیم و با استفاده از دستهبند درختCART آنها را جهت تعیین هویت با استفاده از یک برنامهنویسی ژنتیک مورد بررسی قرار دادیم که نتایج حاکی از صحت شناسایی تا 84 % را در بر دارد

کلیدواژه ها

تعیین جنسیت نویسنده، الگوریتم ژنتیک، درخت تصمیمگیر، شبکه عصبی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.