بهبود اثرات نویز موبایل در بازشناسی گفتار فارسی به روش تبدیل ویولت و مطلوب سازی نویز
- سال انتشار: 1390
- محل انتشار: چهارمین کنفرانس مهندسی رسانه
- کد COI اختصاصی: IBBEC04_007
- زبان مقاله: فارسی
- تعداد مشاهده: 1444
نویسندگان
عضو هیات علمی گروه کامپیوتر دانشگاه آزاد اسلامی واحد ماکو
عضو هیات علمی گروه کامپیوتر دانشگاه آزاد اسلامی واحد
عضو هیات علمی گروه ریاضی دانشگاه آزاد اسلامی واحد ماکو
چکیده
سیستم پردازش خودکار صوت از زیرسیستمهای مختلفی تشکیل شده که یکی از آنها سیستم بازشناسی خودکار گفتار می - باشد. مشکل این سیستمها با تاثیر عوامل مخرب و نویزهای گوناگون در کاهش نرخ بازشناسی آشکار میشود. در این مقاله، یک پایگاه داده گفتار با دادگان فارسی 0 تا 9 با گویندههای مختلف موبایل پیاده سازی شده است. سپس جهت بهبود سیگنال گفتار، از الگوریتمهای مختلف حذف نویز تبدیل ویولت بصورت پیش پردازش در بازشناسی استفاده شد ه است . آزمایشها با چند تابع و با پارامترهای مختلف انجام و نتایج بهینه گزارش شده است. الگوریتم rigrsure با نرخ 91 % در بازشناسی برای گویندههای آموزش، با دادههای پایگاه، نسبت به 3 الگوریتم دیگر بهتر عمل میکند. لازم به ذکر است که در تبدیل ویولت معمولی بار محاسباتی بالاست. لذا جهت کاهش بار محاسباتی از فیلتر موسوم به WOLA استفاده شد . از طرفی در روش آستانه گذاری این تبدیل ، حد آستانهی محاسبه شده بزرگ می باشد. یعنی الگوریتم های این تبدیل با حذف جزییات سیگنال ب ا آستانه گذاری ، ویژگیهای سیگنال اصلی را نیز تخریب میکنند. جهت جبران این کاستی از باقی گذاشتن قسمتی از نویز در سیگنال اصلی البته با مطلوب سازی نویز با تبدیل ویولت استفاده شد. کارایی تبدیل برپایهی روش اخیر در حدود 4% افزایش نشان میدهد.کلیدواژه ها
بازشناسی گفتار، پردازش صوت، تبدیل ویولت، حذف نویز، مطلوب سازی نویزاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.