نرمال سازی متون فارسی با استفاده از تطابق با الگوی عبارات

  • سال انتشار: 1383
  • محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران
  • کد COI اختصاصی: ACCSI10_083
  • زبان مقاله: فارسی
  • تعداد مشاهده: 2690
دانلود فایل این مقاله

نویسندگان

محمدحسین معطر

آزمایشگاه سیستمهای هوشمند صوتی گفتاری دانشگاه صنعتی امیرکبیر

محمدمهدی همایون پور

ناصر فرزین فر

چکیده

نرمالسازی یکی از مسائل مهمدر پردازش متن و تبدیل متن به گفتار است دراین مقاله به بررسی عمل نرمال سازی متون فارسی وهمچنین مسائل مطرح در آن می پردازیم در آغاز به بررسی جوانب مختلف کار درعمل نرمال سازی متون فارسی می پردازیم و سپس راه هایی را برای آن پیشنهادمی کنیم این راه حلها علیرغم ساده بودن نیازهای موجوددر نرمال سازی را برطرف می کند اما عیوبی نیز دارند که هدفما دراین مقاله نیز بررسی عیوب اینگونه روشها است روش پیشنهادی پیاده سازی و برروی مجموعه ای از متون فارسی در زمینه های مختلف ارزیابی گردیده است. نتایج بررسی ها نشان میدهد که برای رفع نواقص روش پیشنهادی نیاز به یک موتور پردازش زبان طبیعی نیز وجود دارد.

کلیدواژه ها

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.