شناسایی گرامر زبان فارسی با استفاده از تجزیه گر پیشگو
محل انتشار: سومین کنفرانس ملی تکنولوژی مهندسی برق و کامپیوتر
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 573
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ETECH03_107
تاریخ نمایه سازی: 1 مرداد 1397
چکیده مقاله:
تجزیه و ترکیب نحوی زبانهای طبیعی یکی از چالشهای پیشروی پژوهشگران حوزه پردازش زبان طبیعی است که دارای دو بخش عمده میباشد. اول ارایه گرامری که بتواند با ترکیب واژگان یک زبان، جملاتی با ساختار نحوی درست بسازد و دوم طراحی تجزیه گری که با بکارگیری گرامر، منجر به تجزیهی جملات به ساختارهای نحوی آنها شود. در این مقاله، ابتدا یک گرامر مستقل از متن برای زبان فارسی ارایه شده که شامل مجموعه ای از 128 قانون گرامری میباشد. نمونه هایی از این قوانین در این مقاله آورده شده است. این گرامر تولید کننده ی جملات باترتیب و فعل-انتها در زبان فارسی است . سپس یک تجزیه گر پیشگو که مبتنی بر گرامر پیشنهادی میباشد، ارایه شده است. همراه با تجزیهگر، جدول تجزیه ای ساخته شده است که به تجزیه ی جملات زبان فارسی کمک میکند. با بکارگیری جدول تجزیه، خطاهای نحوی جملات فارسی شناسایی می شوند. رویکرد پیشنهادی مبتنی بر متدهای تجزیه بالا به پایین است و برای کاهش ابهام در تجزیه گر، عمل فاکتورگیری بر روی گرامر اولیه صورت پذیرفته است. در ارزیابی این گرامر، از جملات برچسب گذاری شده ی پیکره ی وابستگی نحوی زبان فارسی استفاده کردهایم. تجزیه گر پیشنهادی با نرخ پذیرش %71,8 موفق به تجزیه جملات فارسی شده است، که افزایش نرخ پذیرش، با توسعه گرامر امکانپذیر است.
کلیدواژه ها:
پردازش زبان طبیعی ، تجزیه گر پیشگو ، جدول تجزیه ، فاکتورگیری چپ ، گرامر زبان فارسی ، گرامر مستقل از متن
نویسندگان
سودابه محمدی
دانشکده فناوری اطلاعات، دانشگاه صنعتی کرمانشاه کرمانشاه، ایران