پردازش زبان طبیعی :روشها و مدلهای برچسب گذاری اجزای کلام

  • سال انتشار: 1403
  • محل انتشار: اولین کنفرانس بین المللی فناوری اطلاعات، مدیریت و کامپیوتر
  • کد COI اختصاصی: CONFIT01_0530
  • زبان مقاله: فارسی
  • تعداد مشاهده: 49
دانلود فایل این مقاله

نویسندگان

جلال تباشیر

دانشجوی دکتری زبانشناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران

چکیده

برچسب گذاری اجزای کلام به معنی انتساب برچسب های واژگانی به واژههای درون یک متن ، یکی از مهم ترین مباحث در حوزه پردازش زبان طبیعی است و همچنین پایه و اساس بسیاری از مباحث مطرح ازجمله ماشین های ترجمه ، غلط یابها، خلاصه سازها، استخراج اطلاعات، داده کاوی و ... است . پژوهش حاضر، به مطالعه برچسب گذاری اجزای کلام می پردازد؛ بنابراین ، سعی شده است تا به مباحث زبانشناسی رایانشی ، پیکرهای ، پردازش زبان طبیعی به طور عام و برچسب گذاری اجزای کلام به طور خاص، پرداخته شود. با توجه به مطالعات انجامگرفته در زبان فارسی ، استفاده از روشهای آماری نسبت به سایر روشها رایج تر و یکی از پرکاربردترین مدلهای آماری در برچسب گذاری اجزای کلام در زبان فارسی ، مدل مخفی مارکوف است . مطالعات انجام شده، به مدلها و روشهای برچسب -گذاری در زبان فارسی پرداخته اند و روشها و مدلهایی را پیشنهاد یا ارائه کرده اند؛ اما هنوز در این زمینه ، مشکلاتی وجود دارد که در جهت بهبود آنها باید تلاشهایی صورت بگیرد.

کلیدواژه ها

پردازش زبان طبیعی ، برچسب گذاری اجزای کلام، روشهای برچسب گذاری ، مدلهای برچسب گذاری ، زبان فارسی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.