ارائه یک مدل ترکیبی جدید بر پایه شبکه های عصبی عمیق برای تشخیص موجودیت ها در اسناد متنی
سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 208
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
BECE02_097
تاریخ نمایه سازی: 2 مرداد 1403
چکیده مقاله:
در سا لهای اخیر، شبکه های عصبی عمیق به عنوان یک روش یادگیری جدید و موثر در بسیار از کاربردهای پردازش زبان طبیعی معرفیشده اند. یکی از این کاربردها تشخیص موجودیت نامدار است که نقش حیاتی در سیستم هایی مانند سیستم های پرسش/پاسخ و مترجم هادارد. ازآنجایی که تکنیک های سنتی برای استخراج موجودیت نیاز به محاسبات زیادی برای شناسایی ویژگی ها دارند؛ لذا مدل های شبکه هایعصبی عمیق برای غلبه بر این چالش ارائه شده اند. در این تحقیق ما یک معماری جدید معرفی می کنیم که در آن دو مدل شبکه هایعمیق به نام های CNN و LSTM با هم ترکیب می شوند تا ویژگی بیشتری از جمله ورودی استخراج شود. ما آزمایشاتمان را روز دو دیتاستعمومی به نام های ACE۰۵ و CoNLL۰۳ پیاده کردیم. ارزیابی ها نشان میدهد که بکارگیری مدل CNN برای استخراج ویژگی های محلیکلمات در کنار LSTM منجر به بهبود کارایی سیستم تشخیص موجودیت می شود و نتایج به طور چشمگیری بهبود می یابد. با مقایسه باکارهای دیگران که از رو شهای استخراج ویژگی دستی استفاده می کنند یا مولفه های کمتری در معماری سیستمشان بکار می گرفتند،برتری معماری پیشنهادی ما را از لحاط دقت اثبات می کند.
کلیدواژه ها:
نویسندگان
الهام پارسایی مهر
استادیار گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، واحد شوشتر، دانشگاه آزاد اسلامی، شوشتر، ایران