ابهام زدایی معنایی کلمات : مروری بر مفاهیم و تکنیک های قابل استفاده

  • سال انتشار: 1397
  • محل انتشار: سومین کنفرانس ملی در مهندسی کامپیوتر، فناوری اطلاعات و پردازش داده ها
  • کد COI اختصاصی: CITCOMP03_017
  • زبان مقاله: فارسی
  • تعداد مشاهده: 3217
دانلود فایل این مقاله

نویسندگان

معصومه طالبی فرد

دانشجوی کارشناسی ارشد مهندسی کامپیوتر- نرم افزارگروه کامپیوتر، واحد بندرعباس، دانشگاه آزاد اسلامی، بندرعباس، ایران

عباس عکاسی

استادیارگروه کامپیوتر، واحد بندرعباس، دانشگاه آزاد اسلامی، بندرعباس، ایران

زینب بلالی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر- نرم افزارگروه کامپیوتر، واحد بندرعباس، دانشگاه آزاد اسلامی، بندرعباس، ایران

چکیده

ابهام زدایی معنایی کلمات یک امر مهم و چالشبرانگیز در پردازش زبان طبیعی است. در هر زبان، کلماتی مبهم وجود دارند که دارای معانی متفاوتی هستند. مسیله یافتن معنای صحیح کلمه ی دارای معانی متعدد، از مسایل جاری در حوزه پردازش زبانهای طبیعی محسوب میشود. انتخاب معنی درست، ممکن است برای انسان بسیار واضح و آسان باشد ولی تشخیص این که کدام یک از معانی موجود برای یک کلمه بایستی در جمله خاص انتخاب شود، برای ماشین دشوار است. ابهام زدایی معنایی کلمات به تنهایی هدف نمی باشد؛ بلکه به عنوان یک کار میانی در سیستم های دیگر از جمله ترجمه ماشینی، یادگیری ماشین، خلاصه سازی متن، تجزیه و تحلیل محتوا، استخراج اطلاعات و یا بازیابی اطلاعات مورد استفاده قرار میگیرد و باعث افزایش دقت آنها میشود. باوجود اهمیت کار ابهامزدایی معنایی کلمات و محبوبیت آن، به عنوان یک موضوع مورد مطالعه، ابزار و منابعی که ابهام زدایی مفهوم کلمات را حمایت کنند، تعمیم و استاندارد کمی دیده شده است. یکی از موانع اصلی برای کارایی بالا در ابهام زدایی معنایی کلمات، تنگنا و محدودیت در کسب دانش است. دانش نهفته در هستهی ابهامزدایی معنایی کلمات، وظیفه ی محاسباتی و شناسایی معنایی کلمات در متن را دارد. در سالهای اخیر، روشهایی مورد مطالعه قرار گرفته اند. در این مقاله برآنیم تا به صورت خلاصه روش های یادگیری و تکنیکهایی را که در حال حاضر برای ابهام زدایی معنایی کلمات استفاده میشود را شرح دهیم و با جمع آوری کارهای مرتبط انجام شده در این حوزه بتوانیم کمکی به دیگر محققین کنیم.

کلیدواژه ها

پردازش زبان طبیعی، ابهام زدایی معنایی کلمات، یادگیری ماشین، ترجمه ماشینی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.