شناسایی زبان گفتاری بر پایه طیفی –زمانی برنامه ها

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 626

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SENACONF01_096

تاریخ نمایه سازی: 25 فروردین 1394

چکیده مقاله:

بازشناسی زبان گفتار اتوماتیک یاLIDیک فرایند مشخص کردن هویت زبان مربوطه و دادن مجموعه ای از سری های گفتار است .مراحلی که برای بازشناسی زبان استفاده می شود شامل 2 مرحله اصلی است 3- استخراج ویژگی از زبانمربوطه 2- طبقه بندی این ویژگی با استفاده از الگوریتم های مناسب .ما یک الگوریتم طبقه بندی صوتی روی ویژگی های مدولاسیون طیفی- زمانی که به وسیله یک مدل پردازش قشری شنیداری الهام گرفته شده اعمال می کنیم .وظیفه کشفشده تشخیص گفتارهای مختلف از جمله انگلیسی و فارسی و فرانسوی است . مدل یک ارائه طیفی- زمانی از صدا تولیدکرده , که سپس به وسیله یک ماشین بردار پشتیبان طبقه بندی می شود . سیستم ایجاد شده با سیستم های موجود مقایسه می شود .این مدل محاسباتی سیستم شنیداری انسان شامل دو مرحله پردازش پایه است مرحله اول سیستمشنیداری گوش را مدل می کند که سیگنال های صوتی را به ارائه عصبی تبدیل می کند و طیف نگاره شنیداری نامیده میشود این ارائه یک توزیع زمان-فرکانس در طول یک محورtonotopicاست .در مرحله دوم محتوای مدولاسیون زمانی از طیف نگاره شنیداری به وسیله اعمال یک تبدیل موجک به هر ردیف از طیف نگاره شنیداری برآورد می شود .تجزیه و تحلیل اجزاهای اصلی چندخطی غیر منفی برای کاهش ابعاد بدون نظارت پیشنهاد شدهnmpca.کل تنسورهای پراکنده را افزایش می دهد در حالی که ارائه شنیداری غیر منفی را حفظ می کندnmpca.در مقابل 1 تکنیک تجزیه و تحلیل زیر فضای چند خطی مقایسه می شود که نامهای آنها DCوفاکتور گیری ماتریس غیر منفی وRPهستند .به طور مثال فاکتور گیری ماتریس غیر منفی وDS ویژگی ها را استخراج می کنند که پس از آن بوسیله طبقه بندی کننده ماشین بردار پشتیبان طبقه بندی می شود . 1 مجموعه مختلف از آزمایشات رویDB انجام شده است .در این کار برتری این مدل را در مقابل مدل ضرائب کپسترال فرکانس مل 5در استخراج ویژگی نشان می دهیم .براین اساس با اعمال این مدل روی پایگاه داده واستخراج ویژگی دقت طبقه بندی بهتری گزارش می شود

نویسندگان

سیدشهاب الدین طباطبایی

استاد راهنما: استاد مشاور

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Y. C.Cho, And S. Choi, "Nonnegetive Features Of Spectro- Temporal ...
  • S. Ikbal , M. Magimai .-Doss, H. Misra, And H. ...
  • S. Wu, T. H.Falk, And W. Y.Chan, _ Speech Emotion ...
  • نمایش کامل مراجع