تشخیص سن از روی سیگنال صوتی با استفاده از طیف گفتاری

  • سال انتشار: 1395
  • محل انتشار: دومین همایش ملی مباحث نوین در حسابداری،مدیریت و کارآفرینی
  • کد COI اختصاصی: MINOOSEMINAR02_089
  • زبان مقاله: فارسی
  • تعداد مشاهده: 606
دانلود فایل این مقاله

نویسندگان

امیر مزینی

دانشجوی کارشناسی ارشد، گروه برق، واحد بجنورد، دانشگاه آزاد اسلامی، تربت حیدریه، ایران

محمد نصیری

دانشجوی دکتری، گروه برق، عضو هیات علمی دانشگاه آزاد اسلامی واحد بجنورد، مشهد، ایران

چکیده

برآورد سن از طریق ویژگی های گفتار انسان یک موضوع جالب در تشخیص خودکار صدا است. اگرچه مطالعات زیادی در این زمینه وجود دارد اما نیاز به مطالعات بیشتر به ویژه برای گویندگان فارسی زبان وجود دارد. در برآورد سن مانند سایر سیستم هایپردازش صدا ما با دو چالش اساسی روبه رو هستیم، ابتدا پیدا کردن روشی مناسب برای استخراج ویژگی های صدا و سپس انتخاب یکروش قابل اعتماد برای الگوی طبقه بندی. در این مقاله ما یک سیستم تخمین سن برای طبقه بندی چهار گروه سنی مختلف پیشنهادکرده ایم. ضرایب پیش بینی خطی ادراکی و ضریب کپسترال مل- فرکانس به عنوان ویژگی های گفتار استخراج و مدل پرسپترون چندلایهبرای روش طبقهبندی استفاده شده است. در نهایت، نتایج حاصل از این تحقیق با روش ماشین بردار پشتیبانمقایسه شده است. بر این اساس ما توانستیم با کمک شبکه عصبی از نوعپرسپترون چند لایه درصد خطا را نسبت به روش ماشین بردار پشتیبان، به میزان قابل توجهی بهبود دهیم. هدف اصلی ما ایجاد یک سیستم خودکار سریع جهت تخمین سن افراد و همچنین بالا تر بردن دقت تخمین سن می باشد.

کلیدواژه ها

تخمین سن، ماشین بردار پشتیبان، شبکه عصبی پرسپترون چند لایه،، ضرایب پیش بینی خطی ادراکی، ضرایب کپسترال مل فرکانسی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.