تشخیص هویت کلمه چندزبانه با یادگیری بدون نمونه: مطالعه موردی زبان آلمانی

سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 169

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CELCONF03_029

تاریخ نمایه سازی: 25 مهر 1403

چکیده مقاله:

در این پژوهش، با هدف ارتقای کارایی سیستم های تشخیص هویت کلمه در متون چند زبانه، رویکرد نوینی مبتنی بر یادگیری بدون نمونه و مدل زبانی پیشرفته XLM-RoBERTa ارائه شده است مدل پیشنهادی با استفاده ازمجموعه داده XTREME و به طور خاص زیر مجموعه PAN-X بر روی داده های زبان آلمانی آموزش دیده است.باتوجه به توانایی مدل های ترانسفورمر در درک ساختارهای زبانی پیچیده و یادگیری نمایش های غنی از متن، توانسته است بدون نیاز به آموزش مجدد بر روی داده های برچسب گذاری شده زبان ایتالیایی، عملکرد قابل قبولی در تشخیص نهادهای نام گذاری شده در این زبان از خود نشان دهد. نتایج تجربی حاکی از آن است که رویکرد پیشنهادی به طور قابل توجهی بر عملکرد سیستم های تشخیص هویت کلمه در زبان های کم منابع تاثیر گذار بوده و گامی مهم در جهت توسعه سیستم های پردازش زبان طبیعی چند زبانه محسوب می شود که می تواند در استخراج اطلاعات از متون خبری،تحلیل احساسات در شبکه های اجتماعی و پاسخگویی به پرسش های پیچیده مورد استفاده قرار گیرد.

نویسندگان

علی طاهری

کارشناسی ارشد هوش مصنوعی،دانشگاه جامع امام حسین (ع) ، تهران

محمدعلی جوادزاده

استادیار دانشگاه جامع امام حسین (ع)، تهران