تشخیص جنسیت گوینده با استفاده از ماشین بردار پشتیبان (SVM) و ویژگی های MFCC، LPC و LPCC

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 524

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

MHCONF05_116

تاریخ نمایه سازی: 12 شهریور 1399

چکیده مقاله:

هدف از این پروژه تشخیص جنسیت گوینده با استفاده از ویژگی های MFCC ، LPC ، LPCC و مدل دسته بندSVM است. از یک مجموعه داده کوچک فارسی به این منظور استفاده شده است. در روش پیاده سازی شده برایتشخیص جنسیت گوینده، ابتدا صوت فریم بندی شده و از هر فریم ویژگیهای MFCC ، LPC ، LPCC استخراجمی شود. این مرحله در واقع توصیفی فرکانسی از فریم را مدل می کند. در واقع ما انتظار داریم فریم های متناظر باجنسیت خاصی از (مثلا فریم های مربوط به مردان) بردار ویژگی MFCC مشابهی داشته باشند. به عبارت دیگراختلاف آنها ناچیز باشد. ویژگی های (مجموعا 36 ویژگی) هر فریم از یک صوت مربوط به یک گوینده، با برچسبجنسیت آن گوینده (1 [مرد] یا 2 [زن]) به دسته بند ما شین بردار پشتیبان داده می شود. برای مثال فرض کنید یکصوت مردان، شامل 100 فریم باشد. از این 100 فریم، 100 بردار ویژگی 36 -تایی (3 نوع ویژگی 12 بعدی) بهدسوت می آید. هرکدام از این 100 بردار (36 - بعدی) به دست آمده برچسب 1 می خوراد و به دسته بند دادهمی شواد. در هنگام آزمون مدل آموزش دیده شده همین فرآیند تکرار می شود با این تفاوت که 100 برچسب توسطمدل SVM پیش بینی می شود. برای به دست آوردن برچسب، بین 100 پیش بینی به دست آمده رای اکثریت گرفتهمی شود تا برچسب نهایی یک صوت به عنوان یک زن یا مرد پیش بینی شود. در این پروژهش دقت دسته بندیفریم های آزمون 89 % و دقت دسته بندی در سطح صوت های آزمون 100 % به دست آمد.

کلیدواژه ها:

تشخیص جنسیت گوینده ، ماشین بردار پشتیبان (LPC ، MFCC ، (SVM

نویسندگان

مجید رحمتی

دانشجوی دکتری برق و الکترونیک، گروه برق، واحد سمنان، دانشگاه آزاد اسلامی، سمنان، ایران