ادغام دو ویژگی MFCC و LPCC با استفاده از الگوریتم PSO برای تشخیص جنسیت گوینده صدا

نوید خزین قناد; مهسا وفایی; محمدحسین معطر

ادغام دو ویژگی MFCC و LPCC با استفاده از الگوریتم PSO برای تشخیص جنسیت گوینده صدا

محل انتشار: سومین کنفرانس بین المللی پژوهشهای کاربردی در مهندسی کامپیوتر و فن آوری اطلاعات

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 912

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/467081

شناسه ملی سند علمی:

CITCONF03_510

تاریخ نمایه سازی: 12 تیر 1395

چکیده مقاله:

ویژگی های ضرایب کپسترال بر پایه مل MFCCو ضرایب کپسترال بر پایه پیش گویی خطی LPCC دو ویژگی موفق در زمینه دسته بندی های حوزه گفتار مخصوصا تشخیص جنسیت گوینده صدا شناخته میشود. دراین مقاله باارائه یک روش جدید ونوارائه شده است که با استفاده از الگوریتم PSO ضریبهایی از ویژگی MFCC,LPCC که باعث افزایش دقت دسته بندی می شوند را انتخاب و ضرایبی که تاثیرمنفی درافزایش دقت دسته بندی دارد را حذف دارد. ضرایب مفید موجود در این دو ویژگی با هم ادغام می شوند و از ان برای تشخیص جنسیت گوینده صدا استفاده می گردد نتایج نشان می دهد صحت تشخیص جنسیت گوینده صدا برای 50 صدای مرد و زن مختلف با استفاده از روش پیشنهادی نسبت به ویژگی MFCC وLPCC بیشتر بودهاست. در صورتی که در هر محیط نویزی ار ضرایب بهینه مخصوص به خودش استفاده گردد میتوان دقت دسته بندی بالاتر از 90 درصد رادر تمامی محیط هاینویزی غیر از محیط نویزی Volvo داشته باشیم.

کلیدواژه ها:

تشخیص جنسیت گوینده صدا ، دسته بندی SVM ویژگی MFCC ویژگی LPCC ، مقاومسازی دربرابر نویز

نویسندگان

نوید خزین قناد

دانشجوی کارشناسی ارشد هوشمصنوعی دانشگاه آزاد اسلامی واحد مشهد ایران

مهسا وفایی

دانشجوی کارشناسی ارشد هوشمصنوعی دانشگاه آزاد اسلامی واحد مشهد ایران

محمدحسین معطر

عضو گروه هیئت علمی هوش مصنوعی دانشگاه آزاد اسلامی واحدمشهد ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Anandthirtha B. Gudi, H.K. Shreedhar and H. C. Nagaraj, "Signal ...
Anandthirtha B. Gudi, and H. C. Nagaraj, "Optimal Curve Fitting ...
Mahdi Homayaoon Poor, Maryam Kharashadiz adeh, Speaker gender recognition with ...
jalil shirazi, Elahe Eb rahimi , Fatemeh Kohneshin, 3d Iranian ...
Ibrahim Patel and Y. SrinivasRao, "Speech Recognition using HMM with ...
Navid khozein Ghanad, Seyed Javad Seyed Mahdavi, "Speaker gender identification ...
Kunj ithapatham Meena , Kulumani Subramaniam , and Muthusamy Gomathy, ...
Philip S.J. Weston a, , Michael D. Hunter a, Dilraj ...
M. Faundez -Zanuy, S. McLaughlin, A. Esposito, A. Hussain, J. ...
Bijankhan, M. et al. (2003). TFarsdat, the telephony Farsi speech ...

نمایش کامل مراجع