تعیین محدوده سنی و زن یا مرد بودن به کمک صدا با استفاده از مدل مخلوط گوسی و شبکه های عصبی
- سال انتشار: 1382
- محل انتشار: یازدهمین کنفرانس مهندسی برق
- کد COI اختصاصی: ICEE11_039
- زبان مقاله: فارسی
- تعداد مشاهده: 1254
نویسندگان
آزمایشگاه سیستم های هوشمند صوتی و گفتاری دانشکده مهندسی کامپیوتر دا
چکیده
با توجه به گسترش استفاده از تلفن و اینترنت برای دسترسی به اطلاعات و خدمات از راه دور، نیاز به تعیین مرد یا زن بودن کاربران برای اِعمال محدودیتهایی در دسترسی به نوع اطلاعات و خدمات احساس می شود . در این مقاله، تعیین مرد یا زن بودن و محدوده سنی گوینده با استفاده از ویژگی های مرتبط با مجرای گفتار و توسط مدل مخلوط گوسی 1 و توسط شبکه عصبی چند لایه پرسپترون 2 صورت گرفته است . در هر دو روش ساختارهای مختلفی در نظر گرفته شدهو کارایی آنها با هم مقایسه گردیده است . از ضرائب کپسترال مبتنی بر آنالیز پیشگوئی خطی و نیز از ضرایب کپسترالمبتنی ب ر معیار مِل و مشتق اول آنها بعنوان روشها یی برای بازنما یی گفتار استفاده شده است . در روش مخلوط گوسی بهترین راندمان برای تشخ یص زن یا مرد بودن گوینده با استفاده از داده های آزمایشی 98/91% برای تشخیص زن و98/41% برای تشخیص مرد بدست آمد . برای تشخیص محدوده سنی نیز راندمان 96/41% بدست آمد . استفاده از مشتق اول بردار های ویژگی در صورت کافی بودن تعداد مخلوط های گوسی منجر به بهتر شدن نتایج میگردد . شبکه عصبی انتخاب شده، شبکه چند لایه پرسپترونی می باشد که در مقایسه ساختارهای مختلف آن، بهترین نتیجه برای شناسایی مرد یا زن بودن با شبکه ای متشکل از یک نورون در لایه خروجی، 24 نورون در لایه ورودی، 24 و 48 نورون در لایه های مخفی بدست آمد . آموزش این شبکه توسط ضرائب MFCC به همراه مشتق اول آن با استفاده از 6 دق یقه داده آموزشی و 6 ثانیه داده آزمایشی منجر به دستیابی به دقت 100 % گردید. نتایج آزمایشات گویای کارائی بهتر ضرائب کپسترال مبتنی بر معیار مل و نیز کارآمدی هر دو روش مخلوط گوسی و شبکه عصبی در مدل کردن جنسیت و محدوده سنی گوینده ها می باشد.کلیدواژه ها
تعیین زن یا مرد بودن، تعیین محدوده سنی ، مدل مخلوط گوسی، شبکه عصبی چند لایه پرسپترون ،ضرایب کپسترالمقالات مرتبط جدید
- tGraph_PheroWalk : یک الگوریتم جدید برای یادگیری بازنمایی گراف های پویا
- Efficient Triple Modular Redundancy for Reliability Enhancement of DNNs Using Explainable AI
- مقایسه فناوری CMUT با پیزوالکتریک برای کاربرد در تصویربرداری التراسونیک
- بهبود کنترل دست رباتیک به کمک کنترل کننده تطبیقی فازی-PID
- طراحی و شبیه سازی آنتن تک قطبی چند بانده فشرده با تغذیه ریز نوار برای بهبود عملکرد در باندهای فرکانسی ۲.۵، ۳.۸، ۵.۴ و ۶.۹ گیگاهرتز
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.