تشخیص سن از روی سیگنال صوتی با استفاده از طیف گفتاری

امیر مزینی; محمد نصیری

تشخیص سن از روی سیگنال صوتی با استفاده از طیف گفتاری

محل انتشار: اولین همایش ملی شهر ، زندگی ، آرامش

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,016

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > شبکه عصبی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/481949

شناسه ملی سند علمی:

NCCLP01_088

تاریخ نمایه سازی: 9 مرداد 1395

چکیده مقاله:

برآورد سن از طریق ویژگی های گفتار انسان یک موضوع جالب در تشخیص خودکار صدا است. اگرچه مطالعات زیادی در این زمینه وجود دارد اما نیاز به مطالعات بیشتر به ویژه برای گویندگان فارسی زبان وجود دارد. در برآورد سن مانند سایر سیستم های پردازش صدا ما با دو چالش اساسی روبه رو هستیم، ابتدا پیدا کردن روشی مناسب برای استخراج ویژگی های صدا و سپس انتخاب یک روش قابل اعتماد برای الگوی طبقه بندی. در این مقاله ما یک سیستم تخمین سن برای طبقه بندی چهار گروه سنی مختلف پیشنهاد کرده ایم. ضرایب پیش بینی خطی ادراکی و ضریب کپسترال مل- فرکانس به عنوان ویژگی های گفتار استخراج و مدل پرسپترون چند لایهبرای روش طبقهبندی استفاده شده است. در نهایت، نتایج حاصل از این تحقیق با روش ماشین بردار پشتیبان مقایسه شده است. بر این اساس ما توانستیم با کمک شبکه عصبی از نوعپرسپترون چند لایه درصد خطا را نسبت به روش ماشین بردار پشتیبان، به میزان قابل توجهی بهبود دهیم. هدف اصلی ما ایجاد یک سیستم خودکار سریع جهت تخمین سن افراد و همچنین بالا تر بردن دقت تخمین سن می باشد.

کلیدواژه ها:

تخمین سن ، ماشین بردار پشتیبان ، شبکه عصبی پرسپترون چند لایه ، ، ضرایب پیش بینی خطی ادراکی ، ضرایب کپسترال ملفرکانسی

نویسندگان

امیر مزینی

دانشجوی کارشناسی ارشد، گروه برق، واحد بجنورد، دانشگاه آزاد اسلامی، تربت حیدریه، ایران

محمد نصیری

دانشجوی دکتری، گروه برق، عضو هیات علمی دانشگاه آزاد اسلامی واحد بجنورد، مشهد، ایران-