بررسی روش های تعبیه ی کلمات در پردازش متون

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 557

فایل این مقاله در 10 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TETSCONF08_035

تاریخ نمایه سازی: 26 شهریور 1400

چکیده مقاله:

بازنمایی کلمات، پایه و اساس بسیاری از وظایف پردازش زبان طبیعی (NLP) می باشد که معنا و مفهومویژگان را در قالب دنباله ای از اعداد به مدل های پردازش متن منتقل می کند. رویکردهای اخیر برایبازنمایی کلمات که به آنها مدل های تعبیه ی کلمات نیز گفته می شود، دانش موجود در متون را درفضای چند بعدی اعداد حفظ می کند. این رویکردها موجب ارتقای دقت در بسیاری از وظایف NLP مانندطبقه بندی متن، پاسخ به پرسش، استنتاج در متن و تحلیل احساسات شده اند. مدل های تعبیه کلمات کهاکثرا مبتنی بر شبکه های عصبی می باشند، ویژگی های متفاوتی دارند که منجر به تفاوت در نوع و میزانانتقال دانش از متن به مدل می شوند. اگرچه برخی مدل های جدید در وظایف مختلف عملکرد بهتریداشته اند اما هیچ کدام نسبت به دیگری ارجحیت نداشته و در پژوهش های مختلف خواص متفاوتی ازخود نشان داده اند. در این پژوهش ما مهمترین مدل های تعبیه ی کلمات را در دو دسته ی «مدل های مستقل از زمینه کلمات» و «مدل های مبتنی بر زمینه کلمات» مرور کرده ایم و ضمن معرفی روش کار آن ها، به نقد و بررسی چالش های هر مدل پرداخته ایم. ما همچنین به شرح مهمترین ویژگی های اینمدل های تعبیه کلمات و مقایسه ی آنها با هم پرداخته ایم.

کلیدواژه ها:

پردازش زبان طبیعی ، یادگیری ماشین ، بازنمایی کلمات ، تعبیه های مستقل از زمینه کلمات ، تعبیه های مبتنی بر زمینه کلمات

نویسندگان

محمد آذری جعفری

کارشناسی ارشد مهندسی فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه قم