کاربرد مدلهای بیز ناپارامتری در مشکلات پردازش زبان طبیعی

  • سال انتشار: 1397
  • محل انتشار: اولین کنفرانس ملی مهندسی برق، کامپیوتر و فناوری ارتباطات
  • کد COI اختصاصی: ECTCONF01_011
  • زبان مقاله: فارسی
  • تعداد مشاهده: 901
دانلود فایل این مقاله

نویسندگان

سلیمان خزایی

استادیار، گروه آمار، دانشگاه رازی، کرمانشاه،

ساناز سمندری

دانشجوی کارشناسی ارشد، گروه آمار، دانشگاه رازی، کرمانشاه

چکیده

امروزه روشهای بیز ناپارامتری کاربردهای فراوانی در برآورد پارامترها و مدل بندی مسائل دارند. در این مقاله مدلهای بیز ناپارامتری در پردازش زبان طبیعی مورد مطالعه قرار داده شدهاند. استفاده از این مدلها و تعیین توزیع های پیشین مناسب سبب دستیابی به یک مدل قدرتمندتری برای به دست آوردن اطلاعات بیشتر میشود. اگر چه استفاده از این پیشینها در ماشینهای یادگیری و پردازش زبان طبیعی هنوز به اندازه ی کافی مطالعه نشده است . ابتدا روشهای بیز ناپارامتری براساس رایج ترین توزیع پیشین یعنی فرایند دیریکله مورد مطالعه قرار گرفته اند. سپس نمایشهای متفاوت از فرایند دیریکله مانند فرایند رستوران چینی، ساختار استیک بریکینگ، فرایند دیریکله ی سلسله مراتبی و فرایند پیتمن یور معرفی شده اند. در پایا ن چهار راه حل در چارچوب پردازش زبان طبیعی مانند تقسیم بندی کلمه، استخراج عبارت و صف بندی، تجزیه ی مستقل از متن و مدلسازی زبان با استفاده از این مدلهای پیشنهاد شده و روشهای شبیه سازی مونت کارلو ارائه شده است.

کلیدواژه ها

روشهای بیز ناپارامتری، فرایند دیریکله، مدلهای n گرام، روشهای ملایم سازی، گرامر مستقل از متن

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.