کاهش بردار ویژگیهای گفتار با استفاده از الگوریتم PSO و ارزیابی اثربخشی ویژگیهای مختلف گفتار دربازشناسی حالت زبان فارسی
محل انتشار: دومین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات
سال انتشار: 1390
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,195
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCSCIT02_028
تاریخ نمایه سازی: 17 اردیبهشت 1391
چکیده مقاله:
گفتار دارای ویژگیهای بسیاری است که استخراج دقیق آنها می توانددرصحت بازشناسی گفتار نقش بسیار موثری داشته باشد دراین زمینه محققان بسیاری با بررسی این ویژگیها وارایه روشهای مختلف به بهبود صحت بازشناسی و شناسایی حالت گفتار پرداخته اند از جمله این ویژگیها می توان به ضرایب MFCC انرژی و فرکانسهای فرمنت و فرکانس گام اشاره نمود که نقش بسیار مهمی در سیستمهای شناسایی حالت گفتار دارنددراین مقاله به اثر این ویژگیها دربازشناسی حالت گفتار پرداخته می شود و چهارحالت عصبی angry خوشحالی happy طبیعی natural و سوالی question موردآزمایش قرارمیگیرند دراین تحقیق ویژگیهای مختلفی از گفتار به صورت بردار حاوی 55 ویژگی مورد بررسی قرار میگیرد درمرحله ی بعد به کم ک الگوریتم بهینهسازی PSO بردارهای ویژگی 49 و 24 و 15 تایی بدست می آید که هرچه بردارهای مورد استفاده از ویژگیهای کمتری تشکیل شده باشند سرعت عمل را بالاتر می برند سپس روشهای بهینجارسازی متوسط واریانس و بهره ی کپسترال روی این بردارها به کار گرفته می شوند و با استفاده از الگوریتم GMM بازشناسی حالت گفتار روی بردارهای بهنجار شده صورت میگیرد.
کلیدواژه ها:
نویسندگان
نسیم چقاقاسمی
دانشجوی کارشناسی ارشد الکترونیک
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :