افزایش کارآیی سیستم تشخیص گوینده مستقل ازمتن بااستفاده ازویژگیهای ترکیبی مبتنی براستخراج دقیق فرکانس پایه

نونا حیدری اصفهانی; حمید محمودیان; غزال شیخی

افزایش کارآیی سیستم تشخیص گوینده مستقل ازمتن بااستفاده ازویژگیهای ترکیبی مبتنی براستخراج دقیق فرکانس پایه

محل انتشار: پنجمین کنفرانس ملی مهندسی برق و الکترونیک ایران

سال انتشار: 1392

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 639

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > شبکه عصبی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/219735

شناسه ملی سند علمی:

ICEEE05_419

تاریخ نمایه سازی: 3 آذر 1392

چکیده مقاله:

دراین مقاله سعی شده است باافزودن اطلاعات فرکانس پایه ،کارایی سیستم تشخیص گوینده مستقل ازمتن مبتنی برشبکه عصبی پرسپترون چندلایه بهبود داده شود برای تشخیص دقیق نواحی واکدار/بی واک و استخراج فرکانس پایه روش جدیدی معرفی شده است که ازمایشات کارایی آن را درمقایسه با سایرروشهای متداول درنسبت های سینگال به نویز زیاد و متوسط نشان میدهند سیستم تشخیص گوینده اصلی مبتنی برویژگیهای mfcc است و اطلاعات فرکانس پایه ازجمله مقدارفرکانس درهرفریم میانگین مدین، حداقل وحداکثر فرکانس درهرجمله به بردارویژگی اضافه شده است نتایج نشان میدهند افزودن میانگین فرکانس پایه درهرجمله نرخ تشخیص گوینده را به طور میانگین 3درصد وافزودن مقدارفرکانس پایه به همراه میانگین آن نرخ بازشناسی فریم و نرخ تشخیص گوینده را بطور میانگین به ترتیب به میزان 13و4 درصد بهبودمیدهند

کلیدواژه ها:

تشیخص هویت گوینده ، شبکه عصبی MLP ، فرکانس پایه

نویسندگان

نونا حیدری اصفهانی

دانشگاه آزاد اسلامی واحد نجف آباد

حمید محمودیان

دانشگاه آزاد اسلامی واحد نجف آباد

غزال شیخی

دانشگاه صنعتی امیرکبیر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Dehak N., "Modeling Prosodic Features With Joint Factor Analysis for ...
Helander X., Nurminen X., "On the importance of prosody _ ...
Farell K.R., Mammone R. Assaleh K.T., "speaker ...
recognition using neural networks and conventional classifiers, " ieee trans. ...
Ramachandran R.P., Farrell K. R., Mammone R.J. Sspeaker rec ognitio ...
Sharma A., Singh S.P., Kumar V. _ Text- independent speaker ...
Chougule S., Rege P., "Language Independent Speaker Identi fication", IEEE ...
Yutai W., Bo L., Xiaoqing J., Feng L., Lihao W., ...
Hanilci C., Ertas F., "Impact of Voice Excitation Features on ...
Pandiaraj S., Keziah N.R., Vinothini S., Gloria L, _ Confidence ...
International Conference On Electronics Computer Technology (ICECT) , _ 3, ...
Harb H., Liming C., ،Gender identification using a general audio ...
Harb H., Chen L., ،Voice-based gender identification in multimedia applications, ...
A Real Time "ه [12] Murad Hossain Md., Ahmed B., ...
Katz M., "Fractals and the analysis of waveforms, C Comput. ...
Haykin S., "Neural Networks", Macmillan College Publishing Company, 1999. ...
Sohn J., Kim N.S., Sung W., _ Statistical Model-Based Voice ...

نمایش کامل مراجع