تقطیع گفتار پیوسته فارسی در سطح واجها

  • سال انتشار: 1382
  • محل انتشار: یازدهمین کنفرانس مهندسی برق
  • کد COI اختصاصی: ICEE11_021
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1013
دانلود فایل این مقاله

نویسندگان

محمدمهدی همایون پور

آزمایشگاه سیستم های هوشمند صوتی و گفتاری دانشکده مهندسی کامپیوتر، دا

محمد آزاد

چکیده

استفاده از شیوه های مبتنی برتکنیک تمایز سنجی با استفاد ه از معیار فاصله در تقطیع اتوماتیک سیگنال گفتاربویژه در سطح واج کارایی بهتری دارد . برای این کار از خاصیت قطعه ای سیگنال گفتار و وجود تغییرات نسبتا زیاد آن در فاصله بین قطعات مجاور استفاده می شود . در این مقاله تقطیع گفتار در سطح واج با روش تفاضل طیفی و با بررسی تاثیر طول فریم مورد آنالیز ، تعداد فریمهای مورد آنالیز ، میزان همپوشانی فریمها و ... انجام و نتایج ارایه شده است . در ارزیابی نتایج ، آزمایشاتی بر روی 40 جمله از پایگاه داده فارس دات که شامل حدود 1210 واج که مرز بین آنها با تقطیع دستی مشخص شده است انجام گردید . این روش با تنظیم پارامترها در بهترین حالت می تواند درصد آشکارسازی درست مرز بیش از 92 درصد با نرخ تقطیع مضاعف کمتر از 85 درصد را بر روی محدوده زمانی قابل قبول 30 ± میلی ثانیه به دست دهد.

کلیدواژه ها

تقطیع گفتار، همردیف سازی ز مانی گفتار، تفاضل طیفی، آوا نویسی، واج نویسی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.