تشخیص جنسیت گوینده با استفاده از ماشین بردار پشتیبان (SVM) و ویژگی های MFCC، LPC و LPCC

  • سال انتشار: 1399
  • محل انتشار: پنجمین همایش بین المللی افق های نوین در مهندسی برق، کامپیوتر و مکانیک
  • کد COI اختصاصی: MHCONF05_116
  • زبان مقاله: فارسی
  • تعداد مشاهده: 525
دانلود فایل این مقاله

نویسندگان

مجید رحمتی

دانشجوی دکتری برق و الکترونیک، گروه برق، واحد سمنان، دانشگاه آزاد اسلامی، سمنان، ایران

چکیده

هدف از این پروژه تشخیص جنسیت گوینده با استفاده از ویژگی های MFCC ، LPC ، LPCC و مدل دسته بندSVM است. از یک مجموعه داده کوچک فارسی به این منظور استفاده شده است. در روش پیاده سازی شده برایتشخیص جنسیت گوینده، ابتدا صوت فریم بندی شده و از هر فریم ویژگیهای MFCC ، LPC ، LPCC استخراجمی شود. این مرحله در واقع توصیفی فرکانسی از فریم را مدل می کند. در واقع ما انتظار داریم فریم های متناظر باجنسیت خاصی از (مثلا فریم های مربوط به مردان) بردار ویژگی MFCC مشابهی داشته باشند. به عبارت دیگراختلاف آنها ناچیز باشد. ویژگی های (مجموعا 36 ویژگی) هر فریم از یک صوت مربوط به یک گوینده، با برچسبجنسیت آن گوینده (1 [مرد] یا 2 [زن]) به دسته بند ما شین بردار پشتیبان داده می شود. برای مثال فرض کنید یکصوت مردان، شامل 100 فریم باشد. از این 100 فریم، 100 بردار ویژگی 36 -تایی (3 نوع ویژگی 12 بعدی) بهدسوت می آید. هرکدام از این 100 بردار (36 - بعدی) به دست آمده برچسب 1 می خوراد و به دسته بند دادهمی شواد. در هنگام آزمون مدل آموزش دیده شده همین فرآیند تکرار می شود با این تفاوت که 100 برچسب توسطمدل SVM پیش بینی می شود. برای به دست آوردن برچسب، بین 100 پیش بینی به دست آمده رای اکثریت گرفتهمی شود تا برچسب نهایی یک صوت به عنوان یک زن یا مرد پیش بینی شود. در این پروژهش دقت دسته بندیفریم های آزمون 89 % و دقت دسته بندی در سطح صوت های آزمون 100 % به دست آمد.

کلیدواژه ها

تشخیص جنسیت گوینده، ماشین بردار پشتیبان (LPC, MFCC, (SVM

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.