ارائه روشی ترکیبی جهت تشخیص زنجیره ی واجی کلمات فارسی

  • سال انتشار: 1393
  • محل انتشار: اولین کنفرانس ملی الگوریتم های فراابتکاری و کاربردهای آن در علوم و مهندسی
  • کد COI اختصاصی: MHAA01_022
  • زبان مقاله: فارسی
  • تعداد مشاهده: 874
دانلود فایل این مقاله

نویسندگان

نرگس تابع معتوقی

دانشجوی کارشناسی ارشد، مهندسی کامپیوتر معماری سیستمهای کامپیوتری

محمد خیراندیش

عضو هیئت علمی گروه مهندسی کامپیوتر معماری سیستمهای کامپیوتری گروه مهندسی کامپیوتر،دانشگاه آزاد اسلامی واحد دزفول

سعید ستایشی

عضو هیئت علمی گروه مهندسی کامپیوتر معماری سیستمهای کامپیوتری گروه مهندسی کامپیوتر،دانشگاه آزاد اسلامی واحد دزفول

چکیده

فاز اول یک سیستم تبدیل متن به گفتار، تبدیل متن به زنجیره واجی آن است. خط فارسی به دلیل دشواری های پردازشی که دارد، ورودی مناسبی برای برنامههای پردازش متن به حساب نمیآید. مهمترین مشکل درسامانههای پردازش زبان فارسی عدم ظاهر شدن مصوتهای کوتاه در نگارش است، که باعث ابهام در خواندن کلمات میشود. هدف اصلی این پژوهش، مطالعه روشهای حل مشکل اصلی ناشی از این مسئله درتعیین زنجیره واجی کلمات فارسی، جهت استفاده در سیستم تبدیل متن به گفتار میباشد، در این راستا با ترکیب روشهای مبتنی بر پیکره و روشهای مبتنی بر قاعده، سیستمی طراحی شده است که شامل پایگاهواژگان با حجم 73 هزار لغت زبان فارسی برگرفته از پیکره واژگان زایا میباشد و جهت ارزیابی یک متن شامل 055 کلمه به سیستم داده شده است و نتایج بدست آمده نشان میدهد که دقت آن در تشخیص دنباله واجی کلمات در جمله معادل با 89 % و در تشخیص دنباله واجی حروف در کلمات معادل با 89 % است.

کلیدواژه ها

تبدیل متن به دنباله واجی، پیکره متنی زبانفارسی، تبدیل متن به گفتار، روشهای ترکیبی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.