بررسی روش های تعبیه ی کلمات در پردازش متون
- سال انتشار: 1400
- محل انتشار: هشتمین کنفرانس بین المللی فناوری های نوآورانه در زمینه علوم، مهندسی و تکنولوژی
- کد COI اختصاصی: TETSCONF08_035
- زبان مقاله: فارسی
- تعداد مشاهده: 940
نویسندگان
کارشناسی ارشد مهندسی فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه قم
چکیده
بازنمایی کلمات، پایه و اساس بسیاری از وظایف پردازش زبان طبیعی (NLP) می باشد که معنا و مفهومویژگان را در قالب دنباله ای از اعداد به مدل های پردازش متن منتقل می کند. رویکردهای اخیر برایبازنمایی کلمات که به آنها مدل های تعبیه ی کلمات نیز گفته می شود، دانش موجود در متون را درفضای چند بعدی اعداد حفظ می کند. این رویکردها موجب ارتقای دقت در بسیاری از وظایف NLP مانندطبقه بندی متن، پاسخ به پرسش، استنتاج در متن و تحلیل احساسات شده اند. مدل های تعبیه کلمات کهاکثرا مبتنی بر شبکه های عصبی می باشند، ویژگی های متفاوتی دارند که منجر به تفاوت در نوع و میزانانتقال دانش از متن به مدل می شوند. اگرچه برخی مدل های جدید در وظایف مختلف عملکرد بهتریداشته اند اما هیچ کدام نسبت به دیگری ارجحیت نداشته و در پژوهش های مختلف خواص متفاوتی ازخود نشان داده اند. در این پژوهش ما مهمترین مدل های تعبیه ی کلمات را در دو دسته ی «مدل های مستقل از زمینه کلمات» و «مدل های مبتنی بر زمینه کلمات» مرور کرده ایم و ضمن معرفی روش کار آن ها، به نقد و بررسی چالش های هر مدل پرداخته ایم. ما همچنین به شرح مهمترین ویژگی های اینمدل های تعبیه کلمات و مقایسه ی آنها با هم پرداخته ایم.کلیدواژه ها
پردازش زبان طبیعی، یادگیری ماشین، بازنمایی کلمات، تعبیه های مستقل از زمینه کلمات، تعبیه های مبتنی بر زمینه کلماتمقالات مرتبط جدید
- انتخاب تامین کننده سبز در صنعت غذایی با استفاده از روش تصمیم گیری فازی
- Designing a Smart Oversight Framework for EPC Contracts in the Oil and Gas Sector Based on Blockchain and Smart Contracts
- Investigation the Effect of Support on Energy Absorption Performance for Reinforcing Auxetic Star Metastructures Under Quasi-Static Loading: A Numerical Study
- Enhancing Security at the Intersection of IoT and the Metaverse: A Comprehensive Framework with Federated Learning, Blockchain, and Explainable AI
- استراتژی های مدیریت بحران در سطح کلان و سازمانی حوزه HSE
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.