بررسی تاثیر نوع ویژگی های گفتاری، مشتقات زمانی و برچسب های واجی در استخراج ویژگی های عمیق گلوگاهی

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 524

فایل این مقاله در 6 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI22_012

تاریخ نمایه سازی: 13 شهریور 1396

چکیده مقاله:

با توجه به اهمیت استفاده از شبکه های عصبی عمیق در بازشناسی خودکار گفتار، در این مقاله با انجام چندین آزمایش مختلف روی مجموعه دادگان گفتاری TIMIT سعی شده است، نحوه استخراج ویژگی های عمیق گلوگاهی، برای انجام بازشناسی خودکار گفتار مورد بررسی قرار گیرد. همچنین جهت بررسی نوع ویژگی های گفتاری ورودی، آموزش بانظارت و تاثیر مشتقات زمانی ویژگی های ورودی آزمایش هایی انجام شده است. از آزمایش های انجام شده مشخص گردید ویژگی های گلوگاهی قادر هستند، در مقایسه با ویژگی های رایج گفتاری مانند MFCC حدود 7 درصد دقت بازشناسی را افزایش دهند. همچنین بهترین دقت بازشناسی از ویژگی های گلوگاهی مربوط به شبکه آموزش دیده بصورت با نظارت، با استفاده از ویژگی ها طیفی مبتنی بر معیار مل (MFSC)، با در نظر گرفتن ویژگی های مشتق زمانی، حاصل شده است.

کلیدواژه ها:

بازشناسی خودکار گفتار ، شبکه عصبی عمیق ، ویژگی های عمیق گلوگاهی

نویسندگان

امیرحسین حاج احمدی

آزمایشگاه پردازش هوشمند داده های چندرسانه ای، دانشکده مهندسی کامپبوتر، دانشگاه صنعتی امیرکبیر، تهران

محمدمهدی همایون پور

دانشیار، آزمایشگاه پردازش هوشمند داده های چندرسانه ای، دانشکده مهندسی کامپبوتر، دانشگاه صنعتی امیرکبیر، تهران