چالش های استفاده از پردازش زبان طبیعی (NLP) در زبان فارسی

سال انتشار: 1394
محل انتشار: دومین کنفرانس ملی توسعه علوم مهندسی
کد COI اختصاصی: AIHE09_221
زبان مقاله: فارسی
تعداد مشاهده: 3230

دانلود فایل این مقاله

نویسندگان

طیبه لاکتراشی

دانشجوی کارشناسی ارشد ،نرم افزار، موسسه آموزش عالی آیندگان،تنکابن

همایون بهشتی

اکبر بهرام پور

دانشجوی کارشناسی ارشد ،نرم افزار، موسسه آموزش عالی آیندگان،تنکابن

چکیده

پردازش متون فارسی شامل گستره وسیعی از پردازش زبان طبیعی است که شامل تحلیل ساختواژی، نحوی و معنایی متون فارسی،سااخت مناب زبانی مانند وازگانها، اطاح ن نامه ها، هستان شناسی های واژگانی، پیکره های خام و برچسب حورده، مجموعه هایمدون قواعد ساختوازی،نحوی و الگو های معنایی، یادگیری ماشینی زبان فارسی اعم از استخراج و اکتساب لغات و ویژگی های آنها،اکتساب قواعد ساختواژی و نحوه و یاد گیری الگو های کاربدی زبان و هعچنین دایره بزرگی از کاربرد ها مانند باز یابی اطلاعات از متونفارسی، خ طه سازی، درک، تولید، ترجعه، پرسش و پاسخ واستخراج دانش از متون زبان فارسی و کاربردهای بسیار دیگر است.در این مقاله به بررسی چالش های موجود در پردازش زبان طبیعی فارسی و ابزار های موجود پرداخته شده است.

کلیدواژه ها

پردازش زبان طبیعی،پیکره،ابزار

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.