بازسازی تکراری گفتار با قابلیت بالا با استفاده از گفتار ترکیبی بازسازی شده

سعید کریمی; مهدی صادق زاده; جواد میرعابدینی

بازسازی تکراری گفتار با قابلیت بالا با استفاده از گفتار ترکیبی بازسازی شده

محل انتشار: همایش ملی پژوهش های کاربردی در علوم و مهندسی

سال انتشار: 1392

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 822

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/290727

شناسه ملی سند علمی:

TIAU01_158

تاریخ نمایه سازی: 14 شهریور 1393

چکیده مقاله:

با توجه به اهمیت موضوع بازسازی گفتار در کاربردهای مختلف ، این موضوع، به یکی از حوزه های مهم تحقیقات در سالهای اخیر تبدیل شده است، در سیستم های رایج برای بازسازی گفتار ازSTFTاستفاده می شود که این کار از طریق طیف فاز یا طیف اندازه یا هر دو اینها انجام می شود و برای استخراج ویژگی ها ازMFCCاستفاده می کنند که اگر سیگنال توسط نویز تخریب شده باشد، نمی تواند بخوبی عملیات بازشناسی را انجام دهد. در این مقاله می خواهیم روشی را ارائه کنیم تا با استفاده از آن بتوان سیگنال گفتاری با قابلیت بالاتر را ایجاد کرد. برای رسیدن به این هدف، سیگنال گفتاری را با استفاده از ترکیب روشMFCCروش بازسازی تکراریSTFTو روشAMS ایجاد می کنیم و در هر مرحله از تکرار عملیات بازسازی گفتار ورودی، بخش بازسازی شده گفتار ورودی را با بخش مطابق با آن در سیگنال وزن بازسازی شده ، ضرب می کنیم. سه آزمایش را مورد بررسی قرار دادیم، در آزمایش اول طول فریم های گفتار ورودی را تغییر دادیم، در آزمایش دوم تعداد تکرار عملیات بازسازی را با تغییر شیفت هایپنجره آنالیز بررسی کردیم و در آزمایش سوم با افزایش نویز به گفتار ورودی آنرا مورد ارزیابی قرار دادیم. ، نتایج نشان می دهد روش ما در ناحیه های همپوشان متفاوت و با فریم هایی با اندازه های مختلف، می تواند سیگنال گفتاری باقابلیت بالاتر را ایجاد کند

کلیدواژه ها:

بازسازی تکراری-بازشناسی گفتار-طیف فاز- طیف انداز . ه

نویسندگان

سعید کریمی

معماری کامپیوتر، دانشجوی کارشناسی ارشد ، مدرس

مهدی صادق زاده

نرم افزار کامپیوتر، دکتری، عضو هیئت علمی

جواد میرعابدینی

نرم افزار کامپیوتر، دکتری، عضو هیئت علمی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Liu, L., He, J., Palm, G. (1997): Effects of phase ...
Alsteris, Leigh D., Paliwal, Kuldip K. (2007): Iterative reconstruction of ...
Paliwal, Kuldip., Schwerin, Belinda., Wojcicki, Kamil. (2011): Role of modulatioh ...
Griffin, D.W., Lim, J.S. (1984): Signal estimation from modified short-time ...
Paliwal, K., Wojcicki, K., Schwerin, B. (2010b): Single-channel speech enhancement ...
Loizou, P., (2007): _ Enhancemen: Theory and Practice. Taylor and ...
Huang, X., Acero, A., Hon, H., (2001): Spoken Language Processing: ...
Quatieri, T., (2002): Discrete-Time Speech Signal Processing: Principles and Practice. ...

نمایش کامل مراجع