معرفی دو روش جدید برای بهبود بازشناسی گفتار با استفاده از الگوهای زمانی

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,219

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEE16_177

تاریخ نمایه سازی: 6 اسفند 1386

چکیده مقاله:

در سیستم های بازشناس گفتار، ویژگی های استخراج شده از هر قاب گفتاری، بیانگر اطلاعات زبانی موجود در آن محدوده زمانی قاب گفتاری است. با در نظر گرفتن توالی بردارهای ویژگی استخراج شده از چند قاب متوالی، ویژگی الگوی زمانی تعریف می گردد که بیانگر دینامیک تغییرات هر یک از ویژگی های گفتاری (باندهای ویژگی) می باشد. در این مقاله دو روش جدید برای بیان چنین الگوهای زمانی معرفی شده است. هر کدام از این روش ها ، به گونه ای سعی در استخراج اطلاعات زمان بلند باندهای مختلف بردار ویژگی دارند. نتایج بازشناسی به دست آمده از ترکیب اطلاعات الگوهای زمانی موجود در باندهای متمایز بردار ویژگی با بردارهای ویژگی معمولی، نشاندهنده بهبود بازشناسی گفتار به میزان 1/2% ، در شرایط آزمون تمیز می باشد. این در حالی است که الگوهای زمانی، قابلیت بیشتری در بهبود میزان بازشناسی در شرایط آزمون نویزی دارند. از طرفی دیگر، از آنجا که الگوهای زمانی حاصل شده، بیانگر دینامیک بلند مدت باندهای ویژگی می باشند؛ نتایج بازشناسی آنها با ویژگی های مشتقات زمانی (پارامترهای دلتا بازنمایی) که بیانگر دینامیک کوتاه مدت بردار ویژگی ها هستند و همچنین ترکیب آنها با یکدیگر، مورد ارزیابی و مقایسه قرار گرفته است.

نویسندگان

یاسر شکفته

دانشگاه صنعتی امیرکبیر

فرشاد الماس گنج

دانشگاه صنعتی امیرکبیر

ایوب دلیری

دانشگاه صنعتی امیرکبیر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • یاسر شکفته و فرشاد الماس‌گنج، بهبود بازشناسی گفتار با استفاده ...
  • یاسر شکفته، فرشاد الماس‌گنج و ایوب دلیری، "پردازش غیرخطی و ...
  • ، (ICBME2008) دانشگاه شاهد تهران، بهمن 1386. ...
  • J. B. Allen, ،How do humans process and recognize speech, ...
  • H. Hermansky, and S. Sharma, *Temporal patterns (TRAPS) in ASR ...
  • Multi-Layerd Perceptron: Tonotopic؛ [3] B. Y. Chen, A Neural Network ...
  • M. Athineos, and D. Ellis, _ "Autoregre ssive Modeling of ...
  • B. Milner, ،Inclusion of Temporal Information into features for speech ...
  • FARSDAT, FARSDA T Persian speech database. ...
  • SPIB, SPIB noise data. Available from: <http : //spib .rice ...
  • HTK, HMM Tool Kit. Availabel from: <http : //htk. eng.cam.ac.uk ...
  • نمایش کامل مراجع