شناسایی گرامر زبان فارسی با استفاده از تجزیه گر پیشگو

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 573

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ETECH03_107

تاریخ نمایه سازی: 1 مرداد 1397

چکیده مقاله:

تجزیه و ترکیب نحوی زبانهای طبیعی یکی از چالشهای پیشروی پژوهشگران حوزه پردازش زبان طبیعی است که دارای دو بخش عمده میباشد. اول ارایه گرامری که بتواند با ترکیب واژگان یک زبان، جملاتی با ساختار نحوی درست بسازد و دوم طراحی تجزیه گری که با بکارگیری گرامر، منجر به تجزیهی جملات به ساختارهای نحوی آنها شود. در این مقاله، ابتدا یک گرامر مستقل از متن برای زبان فارسی ارایه شده که شامل مجموعه ای از 128 قانون گرامری میباشد. نمونه هایی از این قوانین در این مقاله آورده شده است. این گرامر تولید کننده ی جملات باترتیب و فعل-انتها در زبان فارسی است . سپس یک تجزیه گر پیشگو که مبتنی بر گرامر پیشنهادی میباشد، ارایه شده است. همراه با تجزیهگر، جدول تجزیه ای ساخته شده است که به تجزیه ی جملات زبان فارسی کمک میکند. با بکارگیری جدول تجزیه، خطاهای نحوی جملات فارسی شناسایی می شوند. رویکرد پیشنهادی مبتنی بر متدهای تجزیه بالا به پایین است و برای کاهش ابهام در تجزیه گر، عمل فاکتورگیری بر روی گرامر اولیه صورت پذیرفته است. در ارزیابی این گرامر، از جملات برچسب گذاری شده ی پیکره ی وابستگی نحوی زبان فارسی استفاده کردهایم. تجزیه گر پیشنهادی با نرخ پذیرش %71,8 موفق به تجزیه جملات فارسی شده است، که افزایش نرخ پذیرش، با توسعه گرامر امکانپذیر است.

نویسندگان

سودابه محمدی

دانشکده فناوری اطلاعات، دانشگاه صنعتی کرمانشاه کرمانشاه، ایران