تعیین محدوده سنی و زن یا مرد بودن به کمک صدا با استفاده از مدل مخلوط گوسی و شبکه های عصبی

  • سال انتشار: 1382
  • محل انتشار: یازدهمین کنفرانس مهندسی برق
  • کد COI اختصاصی: ICEE11_039
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1254
دانلود فایل این مقاله

نویسندگان

محمدمهدی همایون پور

آزمایشگاه سیستم های هوشمند صوتی و گفتاری دانشکده مهندسی کامپیوتر دا

نرگس احمیدی

بهاره مبارک آبادی

چکیده

با توجه به گسترش استفاده از تلفن و اینترنت برای دسترسی به اطلاعات و خدمات از راه دور، نیاز به تعیین مرد یا زن بودن کاربران برای اِعمال محدودیتهایی در دسترسی به نوع اطلاعات و خدمات احساس می شود . در این مقاله، تعیین مرد یا زن بودن و محدوده سنی گوینده با استفاده از ویژگی های مرتبط با مجرای گفتار و توسط مدل مخلوط گوسی 1 و توسط شبکه عصبی چند لایه پرسپترون 2 صورت گرفته است . در هر دو روش ساختارهای مختلفی در نظر گرفته شدهو کارایی آنها با هم مقایسه گردیده است . از ضرائب کپسترال مبتنی بر آنالیز پیشگوئی خطی و نیز از ضرایب کپسترالمبتنی ب ر معیار مِل و مشتق اول آنها بعنوان روشها یی برای بازنما یی گفتار استفاده شده است . در روش مخلوط گوسی بهترین راندمان برای تشخ یص زن یا مرد بودن گوینده با استفاده از داده های آزمایشی 98/91% برای تشخیص زن و98/41% برای تشخیص مرد بدست آمد . برای تشخیص محدوده سنی نیز راندمان 96/41% بدست آمد . استفاده از مشتق اول بردار های ویژگی در صورت کافی بودن تعداد مخلوط های گوسی منجر به بهتر شدن نتایج میگردد . شبکه عصبی انتخاب شده، شبکه چند لایه پرسپترونی می باشد که در مقایسه ساختارهای مختلف آن، بهترین نتیجه برای شناسایی مرد یا زن بودن با شبکه ای متشکل از یک نورون در لایه خروجی، 24 نورون در لایه ورودی، 24 و 48 نورون در لایه های مخفی بدست آمد . آموزش این شبکه توسط ضرائب MFCC به همراه مشتق اول آن با استفاده از 6 دق یقه داده آموزشی و 6 ثانیه داده آزمایشی منجر به دستیابی به دقت 100 % گردید. نتایج آزمایشات گویای کارائی بهتر ضرائب کپسترال مبتنی بر معیار مل و نیز کارآمدی هر دو روش مخلوط گوسی و شبکه عصبی در مدل کردن جنسیت و محدوده سنی گوینده ها می باشد.

کلیدواژه ها

تعیین زن یا مرد بودن، تعیین محدوده سنی ، مدل مخلوط گوسی، شبکه عصبی چند لایه پرسپترون ،ضرایب کپسترال

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.