مروری بر مدل های مختلف تعبیه کلمات درگسترش پرس و جو برای بازیابی اطلاعات

  • سال انتشار: 1399
  • محل انتشار: هفتمین کنفرانس بین المللی یافته های نوین علوم و تکنولوژی با محوریت علم در خدمت توسعه
  • کد COI اختصاصی: DSCONF07_049
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1108
دانلود فایل این مقاله

نویسندگان

فرهنگ پدیداران مقدم

استادیار گروه کامپیوتر، مجتمع آموزش عالی فنی مهندسی اسفراین،

سمیه ناوگی

دانشجوی کارشناسی ارشد، موسسه ی آموزش عالی اشراق بجنورد

چکیده

در این مقاله ما به کاربرد تعبیه کلمات Word Embedding جهت افزایش دقت مدل های زبان پرس و جو در کار های بازیابی اطلاعات می پردازیم .Word embeddings بردارهای کم بعدی هستند که اخیرا برای رسیدن به کارایی موثر در بسیاری از کارهای NLP جهت ارائه اصطلاحات واژگانی که شباهت معنایی بین آنها وجود دارد به کار می رود . روش هایی از Word Embedding مانند کاربرد توابع کسینوسی و تبدیل سیگموئید ، مدل فضایی جاسازی دو تایی ، تعبیه دو زبانه از داده های قابل مقایسه BWE S-G و مدل زبان کلی مبتنی بر تعبیه کلمات برای بازیابی اطلاعات مطرح شده اند و هدف اصلی آشنایی با روش های تعبیه کلمات در گسترش پرس و جو می باشد .

کلیدواژه ها

تعبیه کلمات : Word embeddings ، گسترش پرس و جو : Query Extention ، بازیابی اطلاعات : Information Retrieval

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.