بررسی روش های تعبیه ی کلمات در پردازش متون
سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 750
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
TETSCONF08_035
تاریخ نمایه سازی: 26 شهریور 1400
چکیده مقاله:
بازنمایی کلمات، پایه و اساس بسیاری از وظایف پردازش زبان طبیعی (NLP) می باشد که معنا و مفهومویژگان را در قالب دنباله ای از اعداد به مدل های پردازش متن منتقل می کند. رویکردهای اخیر برایبازنمایی کلمات که به آنها مدل های تعبیه ی کلمات نیز گفته می شود، دانش موجود در متون را درفضای چند بعدی اعداد حفظ می کند. این رویکردها موجب ارتقای دقت در بسیاری از وظایف NLP مانندطبقه بندی متن، پاسخ به پرسش، استنتاج در متن و تحلیل احساسات شده اند. مدل های تعبیه کلمات کهاکثرا مبتنی بر شبکه های عصبی می باشند، ویژگی های متفاوتی دارند که منجر به تفاوت در نوع و میزانانتقال دانش از متن به مدل می شوند. اگرچه برخی مدل های جدید در وظایف مختلف عملکرد بهتریداشته اند اما هیچ کدام نسبت به دیگری ارجحیت نداشته و در پژوهش های مختلف خواص متفاوتی ازخود نشان داده اند. در این پژوهش ما مهمترین مدل های تعبیه ی کلمات را در دو دسته ی «مدل های مستقل از زمینه کلمات» و «مدل های مبتنی بر زمینه کلمات» مرور کرده ایم و ضمن معرفی روش کار آن ها، به نقد و بررسی چالش های هر مدل پرداخته ایم. ما همچنین به شرح مهمترین ویژگی های اینمدل های تعبیه کلمات و مقایسه ی آنها با هم پرداخته ایم.
کلیدواژه ها:
پردازش زبان طبیعی ، یادگیری ماشین ، بازنمایی کلمات ، تعبیه های مستقل از زمینه کلمات ، تعبیه های مبتنی بر زمینه کلمات
نویسندگان
محمد آذری جعفری
کارشناسی ارشد مهندسی فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه قم