پیش بینی پارامتر وضوح گفتار در کلاس های درس با استفاده از شبکه عصبی پرسپترون چند لایه

  • سال انتشار: 1400
  • محل انتشار: یازدهمین کنفرانس بین المللی آکوستیک و ارتعاشات
  • کد COI اختصاصی: ISAV11_018
  • زبان مقاله: فارسی
  • تعداد مشاهده: 434
دانلود فایل این مقاله

نویسندگان

سلمان نوری زه آب

ایران، تهران، خیابان ولیعصر(عج) ابتدای بزرگراه نیایش، دانشگاه صدا و سیمای جمهوری اسلامی ایران، دانشکده فنی

معصومه شفیعیان

ایران، تهران، خیابان ولیعصر(عج) ابتدای بزرگراه نیایش، دانشگاه صدا و سیمای جمهوری اسلامی ایران، دانشکده فنی

چکیده

کلاس درس از مهمترین محیط های آموزشی است که نقش عمده ای در کیفیت آموزش دانش آموزان و دانشجویان دارد. بنابراین بررسی شرایط صوتی این محیط ها به منظور ایجاد جریان صوتی مناسب، اهمیت بسزایی دارد. معمولا برای بررسی و تنظیم شرایط صوتی در کلاس های درس، پارامتر زمان واخنش بررسی و اندازه گیری می شود. اصولا مهمترین پارامتر برای بررسی شرایط آکوستیکی محیط ها، زمان واخنش است ولی این پارامتر به تنهایی می تواند گمراه کننده باشد. ما در این مقاله، در فاز اول، دو کلاس درس آموزشی را شبیه سازی کردیم و مشاهده شد که حتی در صورتی که زمان واخنش های کلاس های درس نزدیک به هم باشد، این امکان وجود دارد که تفاوت قابل توجهی از لحاظ قابلیت درک یا وضوح گفتار بین محیط ها وجود داشته باشد. در نتیجه تمرکز مطلق بر روی زمان واخنش برای بررسی شرایط آکوستیکی محیط و وضوح گفتار، باعث بروز خطا در پیش بینی ها می شود. بنابراین بررسی و اندازه گیری دیگر پارامترهای آکوستیکی مانند پارامتر وضوح گفتار( C۵۰ ) از اهمیت بالایی برخوردار است، از این جهت در این مقاله به بررسی استفاده از شبکه عصبی پرسپترون چندلایه به منظور پیش بینی وضوح گفتار پرداخته شد. به این منظور در فاز دوم، با استفاده از روش های مبتنی بر آکوستیک هندسی و به کمک شبیه ساز اودئون به جمع آوری مجموعه دادگان مورد نیاز در فرکانس ۵۰۰ هرتز و ۲۰۰۰ هرتز پرداخته شد. سپس با استفاده از شبکه عصبی پرسپترون چندلایه، یک سیستم مبتنی بر یادگیری ماشین به منظور پیش بینی وضوح گفتار ارائه شد. در فرکانس ۵۰۰ هرتز، ضریب تعیین ۹۲ درصد و در فرکانس ۲۰۰۰ هرتز، ضریب تعیین ۹۵ درصد ثبت شد. گرچه این مدل بر اساس نتایج شبیه سازی آموزش دیده است ولی این سیستم طراحی شده، این فرصت را به متخصصان می دهد تا در مورد پیش بینی وضوح گفتار ابزار مناسبی داشته باشند.

کلیدواژه ها

آکوستیک کلاس درس؛ وضوح گفتار؛ ردیابی اشعه؛ شبکه عصبی پرسپترون چند لایه

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.