ساخت تحلیلگر پایه جملات فارسی: تلفیق صرف، نحو، معنا

  • سال انتشار: 1386
  • محل انتشار: پانزدهیمن کنفرانس مهندسی برق ایران
  • کد COI اختصاصی: ICEE15_218
  • زبان مقاله: فارسی
  • تعداد مشاهده: 3394
دانلود فایل این مقاله

نویسندگان

مهرنوش شمس فرد

دانشکده مهندسی برق و کامپیوتر، دانشگاه شهید بهشتی

عطیه میرشاه ولد

دانشکده مهندسی برق و کامپیوتر، دانشگاه شهید بهشتی

مژگان پورحسن

دانشکده مهندسی برق و کامپیوتر، دانشگاه شهید بهشتی

سپیده رستم پور

دانشکده مهندسی برق و کامپیوتر، دانشگاه شهید بهشتی

چکیده

یکی از مشکلات و گلوگاه های پردازش متون فارسی عدم وجود منابع زبانی و ابزارهای پردازشی پایه عمومی و در دسترس برای استفاده در فرایند های پیچیده تر پردازش زبان است. در این مقاله، به معرفی مجموعه ابزارهای پایه ساخته شده جهت پردازش متون فارسی می پردازیم. این ابزارها که شامل تحلیلگر ساختواژی و تجزیه گر نحوی است از منابع زبانی تهیه شده شامل دستور زبان محاسباتی و واژگان مفهومی بهره میبنرد. نسخه اولیه این منابع زبانی و ابزارهای پایه به صورت متن باز در اختیار عموم قرار خواهد گرفت.

کلیدواژه ها

پردازش زبان فارسی ، تحلیل ساختواژی ، تجزیه نحوی ، واژگان محاسباتی ، دستور زبان محاسباتی ، ساختار ویژگی ، رفع ابهام معنایی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.