تشخیص جنسیت گوینده با استفاده از ماشین بردار پشتیبان (SVM) و ویژگی های MFCC، LPC و LPCC
- سال انتشار: 1399
- محل انتشار: پنجمین همایش بین المللی افق های نوین در مهندسی برق، کامپیوتر و مکانیک
- کد COI اختصاصی: MHCONF05_116
- زبان مقاله: فارسی
- تعداد مشاهده: 540
نویسندگان
دانشجوی دکتری برق و الکترونیک، گروه برق، واحد سمنان، دانشگاه آزاد اسلامی، سمنان، ایران
چکیده
هدف از این پروژه تشخیص جنسیت گوینده با استفاده از ویژگی های MFCC ، LPC ، LPCC و مدل دسته بندSVM است. از یک مجموعه داده کوچک فارسی به این منظور استفاده شده است. در روش پیاده سازی شده برایتشخیص جنسیت گوینده، ابتدا صوت فریم بندی شده و از هر فریم ویژگیهای MFCC ، LPC ، LPCC استخراجمی شود. این مرحله در واقع توصیفی فرکانسی از فریم را مدل می کند. در واقع ما انتظار داریم فریم های متناظر باجنسیت خاصی از (مثلا فریم های مربوط به مردان) بردار ویژگی MFCC مشابهی داشته باشند. به عبارت دیگراختلاف آنها ناچیز باشد. ویژگی های (مجموعا 36 ویژگی) هر فریم از یک صوت مربوط به یک گوینده، با برچسبجنسیت آن گوینده (1 [مرد] یا 2 [زن]) به دسته بند ما شین بردار پشتیبان داده می شود. برای مثال فرض کنید یکصوت مردان، شامل 100 فریم باشد. از این 100 فریم، 100 بردار ویژگی 36 -تایی (3 نوع ویژگی 12 بعدی) بهدسوت می آید. هرکدام از این 100 بردار (36 - بعدی) به دست آمده برچسب 1 می خوراد و به دسته بند دادهمی شواد. در هنگام آزمون مدل آموزش دیده شده همین فرآیند تکرار می شود با این تفاوت که 100 برچسب توسطمدل SVM پیش بینی می شود. برای به دست آوردن برچسب، بین 100 پیش بینی به دست آمده رای اکثریت گرفتهمی شود تا برچسب نهایی یک صوت به عنوان یک زن یا مرد پیش بینی شود. در این پروژهش دقت دسته بندیفریم های آزمون 89 % و دقت دسته بندی در سطح صوت های آزمون 100 % به دست آمد.کلیدواژه ها
تشخیص جنسیت گوینده، ماشین بردار پشتیبان (LPC, MFCC, (SVMمقالات مرتبط جدید
- استفاده از اینترنت اشیا در بهبود مدیریت بار و افزایش کارایی شبکه های برق
- بهینه سازی توان در سیستم های چند هسته ای با استفاده از یادگیری تقویتی و تخصیص منابع
- بررسی مدارهای مجتمع آنالوگ کم مصرف برای کاربردهای پزشکی
- Physical Layer Security in ۵G Networks Using ArtificialInterference
- یک روش جدید در سیستم های توصیه گر برای پیش بینی سلیقه کاربران با استفاده ازالگوریتم بهینه سازی نهنگ
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.