تشخیص جنسیت گوینده با استفاده از ماشین بردار پشتیبان (SVM) و ویژگی های MFCC، LPC و LPCC
سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 539
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
MHCONF05_116
تاریخ نمایه سازی: 12 شهریور 1399
چکیده مقاله:
هدف از این پروژه تشخیص جنسیت گوینده با استفاده از ویژگی های MFCC ، LPC ، LPCC و مدل دسته بندSVM است. از یک مجموعه داده کوچک فارسی به این منظور استفاده شده است. در روش پیاده سازی شده برایتشخیص جنسیت گوینده، ابتدا صوت فریم بندی شده و از هر فریم ویژگیهای MFCC ، LPC ، LPCC استخراجمی شود. این مرحله در واقع توصیفی فرکانسی از فریم را مدل می کند. در واقع ما انتظار داریم فریم های متناظر باجنسیت خاصی از (مثلا فریم های مربوط به مردان) بردار ویژگی MFCC مشابهی داشته باشند. به عبارت دیگراختلاف آنها ناچیز باشد. ویژگی های (مجموعا 36 ویژگی) هر فریم از یک صوت مربوط به یک گوینده، با برچسبجنسیت آن گوینده (1 [مرد] یا 2 [زن]) به دسته بند ما شین بردار پشتیبان داده می شود. برای مثال فرض کنید یکصوت مردان، شامل 100 فریم باشد. از این 100 فریم، 100 بردار ویژگی 36 -تایی (3 نوع ویژگی 12 بعدی) بهدسوت می آید. هرکدام از این 100 بردار (36 - بعدی) به دست آمده برچسب 1 می خوراد و به دسته بند دادهمی شواد. در هنگام آزمون مدل آموزش دیده شده همین فرآیند تکرار می شود با این تفاوت که 100 برچسب توسطمدل SVM پیش بینی می شود. برای به دست آوردن برچسب، بین 100 پیش بینی به دست آمده رای اکثریت گرفتهمی شود تا برچسب نهایی یک صوت به عنوان یک زن یا مرد پیش بینی شود. در این پروژهش دقت دسته بندیفریم های آزمون 89 % و دقت دسته بندی در سطح صوت های آزمون 100 % به دست آمد.
کلیدواژه ها:
نویسندگان
مجید رحمتی
دانشجوی دکتری برق و الکترونیک، گروه برق، واحد سمنان، دانشگاه آزاد اسلامی، سمنان، ایران