تحلیل سنجمان با استفاده از تکنیک ابهام زدایی معنایی کلمه

  • سال انتشار: 1396
  • محل انتشار: دومین کنفرانس بین المللی پژوهش های دانش بنیان در مهندسی کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: CITCOMP02_019
  • زبان مقاله: فارسی
  • تعداد مشاهده: 949
دانلود فایل این مقاله

نویسندگان

سپیده کیانی نژاد

دانشجوی کارشناسی ارشد مهندسی کامپیوتر، دانشگاه صنعتی مالک اشتر، تهران، ایران

حسین شیرازی

دانشیار، عضو هیات علمی دانشگاه صنعتی مالک اشتر، گروه هوش مصنوعی، تهران، ایران

سعیده سادات سدیدپور

دکتری مهندسی کامپیوتر، دانشگاه صنعتی مالک اشتر، تهران، ایران

چکیده

در هر زبان کلماتی مبهم وجود دارند که یا دارای چند معنی متفاوت هستند و یا به دلیل دارا بودن ساختار نوشتاری یکسان و تلفظ متفاوت، مبهم به شمار می آیند. ابهام معنایی اشاره دارد به حالتی که یک کلمه بیش از یک معنی داشته باشد. مساله ی ابهام زدایی معنایی کلمه، مساله یافتن معنای صحیح برای کلمه ای است که در یک متن یا گفتمان دارای معانی متعددی است. انتساب اتوماتیک معنای صحیح به یک کلمه، یکی از چالش های جاری در حوزه پردازش زبان های طبیعی محسوب می شود. در واقع هر کلمه با توجه به متنی که در آن قرار گرفته است، معنای مناسب خود را پیدا می کند. در این مقاله با استفاده از تکنیک ابهام زدایی معنایی کلمه، به ارایه سیستمی برای تحلیل سنجمان های فارسی پرداخته می شود. در این سیستم با استفاده از تکنیک ابهام زدایی معنایی کلمه به تحلیل سنجمان در سطح پیام پرداخته می شود؛ به طوریکه به منظور تحلیل سنجمان غالب، کل متن پیام مورد تجزیه و تحلیل قرار می گیرد. پژوهش هایی که پیش از این در حوزه ابهام زدایی معنایی کلمه انجام شده است، به تاثیر این تکنیک بر روی تحلیل سنجمان توجهی نداشته اند و این مساله ایست که این مقاله به آن می پردازد. آزمایش های انجام شده نشان می دهد که استفاده از تکنیک ابهام زدایی معنایی کلمه می تواند منجر به بهبود عملکرد سیستم تحلیل سنجمان شود.

کلیدواژه ها

ابهام زدایی معنایی کلمه، تحلیل سنجمان، پردازش زبان طبیعی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.