تشخیص سن از روی سیگنال صوتی با استفاده از طیف گفتاری

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 801

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCLP01_088

تاریخ نمایه سازی: 9 مرداد 1395

چکیده مقاله:

برآورد سن از طریق ویژگی های گفتار انسان یک موضوع جالب در تشخیص خودکار صدا است. اگرچه مطالعات زیادی در این زمینه وجود دارد اما نیاز به مطالعات بیشتر به ویژه برای گویندگان فارسی زبان وجود دارد. در برآورد سن مانند سایر سیستم های پردازش صدا ما با دو چالش اساسی روبه رو هستیم، ابتدا پیدا کردن روشی مناسب برای استخراج ویژگی های صدا و سپس انتخاب یک روش قابل اعتماد برای الگوی طبقه بندی. در این مقاله ما یک سیستم تخمین سن برای طبقه بندی چهار گروه سنی مختلف پیشنهاد کرده ایم. ضرایب پیش بینی خطی ادراکی و ضریب کپسترال مل- فرکانس به عنوان ویژگی های گفتار استخراج و مدل پرسپترون چند لایهبرای روش طبقهبندی استفاده شده است. در نهایت، نتایج حاصل از این تحقیق با روش ماشین بردار پشتیبان مقایسه شده است. بر این اساس ما توانستیم با کمک شبکه عصبی از نوعپرسپترون چند لایه درصد خطا را نسبت به روش ماشین بردار پشتیبان، به میزان قابل توجهی بهبود دهیم. هدف اصلی ما ایجاد یک سیستم خودکار سریع جهت تخمین سن افراد و همچنین بالا تر بردن دقت تخمین سن می باشد.

کلیدواژه ها:

تخمین سن ، ماشین بردار پشتیبان ، شبکه عصبی پرسپترون چند لایه ، ، ضرایب پیش بینی خطی ادراکی ، ضرایب کپسترال ملفرکانسی

نویسندگان

امیر مزینی

دانشجوی کارشناسی ارشد، گروه برق، واحد بجنورد، دانشگاه آزاد اسلامی، تربت حیدریه، ایران

محمد نصیری

دانشجوی دکتری، گروه برق، عضو هیات علمی دانشگاه آزاد اسلامی واحد بجنورد، مشهد، ایران-