تشخیص معنایی کلمات در جمله با استفاده از روش های داده کاوی و شبکه عصبی مصنوعی

  • سال انتشار: 1398
  • محل انتشار: کنفرانس بین المللی فناوری های نوین در سیستم هوشمند
  • کد COI اختصاصی: ICNTLS01_008
  • زبان مقاله: فارسی
  • تعداد مشاهده: 898
دانلود فایل این مقاله

نویسندگان

کارلو آبنوسیان

دانشجوی دکتری گروه آمار، دانشگاه آزاد اسلامی واحدعلوم و تحقیقات، تهران، ایران.

محمد حسن بهزادی

دانشیارگروه آمار، دانشگاه آزاد اسلامی واحدعلوم و تحقیقات، تهران، ایران.

چکیده

برای اینکه بتوان جمله ای را از یک زبان ترجمه و به زبان دیگری تبدیل نمود، ابتدا به یک روال تشخیص واژه ها یا واکافت واژه ای و واکافت ساخت واژی نیاز می باشد، به طوری که کلمات ساده و مرکب آن زبان از ورودی تشخیص داده شود. سپس باید ترکیب کلمات از نظر نحوی صحیح باشد و جمله متعلق به آن زبان را ایجاد نماید. در این مقاله، هدف ایجاد مدلی برای تشخیص نقش معنایی کلمات در جمله می باشد. به این منظور از داده های موجود در پایگاه داده بیجن خان استفاده شده است. این مجموعه استاندارد دارای انواع نقش های کلمات می باشد. مدلی که در این تحقیق پیشنهاد می باشد تمام نقش ها را شامل می شود. یکی از معایب روش های گذشته عملکرد نامطلوب در برخورد با کلمات ناشناخته است. در قدم بعدی این تحقیق سعی شده است از نرمال سازی پایگاه داده استفاده شود تا داده ها به خوبی بتوانند در فرایند آموزش شرکت نمایند. این کار به وسیله نرم افزار داده کاوی انجام شده است تا به روش اصولی و منطقی انجام شود. برای تعیین نقش کلمات در جمله از ساختار جمله، ساختار کلمه و یک پایگاه داده کلمات داده استفاده می شود. الگوریتمی که برای داده کاوی استفاده شده شبکه های عصبی می باشد. شبکه عصبی که در این تحقیق استفاده شده از الگوریتم معروف پس انتشار استفاده می کند. این الگوریتم توانایی بالایی در یادگیری دارد. نتایج حاکی از دقت بسیار خوب شبکه یادگیری عمیق می باشد درصد تشخیص در این روش حدود 5 . 1 درصد افزایش پیدا کرد.

کلیدواژه ها

پیکره بیجن خان،شبکه عصبی مصنوعی،یادگیری عمیق

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.