بهبود استخراج ویژگی با استفاده از یک مدل یادگیری عمیق گروهی برای تشخیص موجودیت

  • سال انتشار: 1401
  • محل انتشار: فصلنامه مدل سازی در مهندسی، دوره: 20، شماره: 69
  • کد COI اختصاصی: JR_JME-20-69_009
  • زبان مقاله: فارسی
  • تعداد مشاهده: 159
دانلود فایل این مقاله

نویسندگان

الهام پارسایی مهر

گروه کامپیوتر، دانشکده مهندسی، دانشگاه آزاد اسلامی واحد اراک،

مهدی فرتاش

گروه مهندسی کامپیوتر، واحد اراک، دانشگاه آزاد اسلامی، اراک، ایران

جواد اکبری ترکستانی

گروه مهندسی کامپیوتر، واحد اراک، دانشگاه آزاد اسلامی، اراک، ایران

چکیده

یکی از مراحل اولیه در بیشتر پردازش های زبان طبیعی، استخراج موجودیت نامدار از جمله است. در این زمینه تکنیک های مختلف مبتنی بر یادگیری ماشین ارائه شده است که بدون نیاز به پیچیدگی های استخراج ویژگی دستی، دقت بالاتری از خود نشان داده اند. لذا، دراین تحقیق ما برای گرفتن ویژگی های جمله ورودی از ترکیب دو مدل یادگیری عمیق شامل شبکه عصبی کانولوشن و همینطور حافظه کوتاه مدت طولانی استفاده می کنیم. با استخراج ویژگی های محلی کلمات توسط شبکه کانولوشن در کنار ویژگی های سراسری، اطلاعات بیشتری از جمله جهت کلاسبندی دقیقتر موجودیتها بدست میآوریم. ما معماری پیشنهادی مان را روی دو دیتاست CoNLL۲۰۰۳ و ACE۰۵ ارزیابی می نماییم و نشان میدهیم که افزودن شبکه کانولوشن سطح کلمه باعث استخراج اطلاعات محلی مفیدی از کلمات موجود در جمله می شود که منجر به افزایش دقت سیستم می گردد. در نهایت، کارایی سیستم را با دیگر رقبا مقایسه مینماییم و برتری این معماری نسبت به دیگران گزارش داده می شود.

کلیدواژه ها

تشخیص موجودیت نامدار, تعبیه گذاری کلمه, LSTM, CNN, پردازش زبان طبیعی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.