ارایه یک الگوریتم کارامد جهت تعیین جنسیت نویسنده درزبان فارسی بااستفاده ازروشهای هوشمند

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 492

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECIE03_016

تاریخ نمایه سازی: 22 دی 1396

چکیده مقاله:

امروزه گسترش فضای مجازی و متعاقب آن فعالیت بیشتر افراد و رفع اکثر نیازهای روزمره خود از این فضا به حد قابل توجهی گسترش یافته است. این موضوع در حالیست که اکثر کاربران این فضا میتوانند با مخفی نگهداشتن شخصیت حقیقی خود اقدام به فعالیت نمایند. راهکارهای شناسایی جنسیت افراد از روی متنهای منتشر شده در فضای مجازی عمدتا بر اساس معیارهای زبانشناسی است. استفاده از این راهکار علاوه بر تعیین هویت افراد می تواند در بازاریابی برخط نیز بسیار موثر باشد چراکه بر اساس آن میتوان روحیات افراد را بر اساس جنسیت شناخت و تبلیغات هدفمندی در این رابطه انجام داد. در این مقاله با توجه به ساختار و نگارش زبان فارسی که دارای ویژگیهای بسیاری است توانستیم الگوریتم کارآمدی که بر اساس روشهای یادگیری ماشین بنا نهاده شده است را ارایه دهیم. در این الگوریتم با استفاده از الگوریتم ژنتیک ویژگی برتر متون را استخراج نمودیم و با استفاده از دستهبند درختCART آنها را جهت تعیین هویت با استفاده از یک برنامهنویسی ژنتیک مورد بررسی قرار دادیم که نتایج حاکی از صحت شناسایی تا 84 % را در بر دارد