بررسی تاثیر نوع ویژگی های گفتاری، مشتقات زمانی و برچسب های واجی در استخراج ویژگی های عمیق گلوگاهی

امیرحسین حاج احمدی; محمدمهدی همایون پور

بررسی تاثیر نوع ویژگی های گفتاری، مشتقات زمانی و برچسب های واجی در استخراج ویژگی های عمیق گلوگاهی

محل انتشار: بیست و دومین کنفرانس ملی سالانه انجمن کامپیوترایران

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 660

فایل این مقاله در 6 صفحه با فرمت PDF و WORD قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/635555

شناسه ملی سند علمی:

ACCSI22_012

تاریخ نمایه سازی: 13 شهریور 1396

چکیده مقاله:

با توجه به اهمیت استفاده از شبکه های عصبی عمیق در بازشناسی خودکار گفتار، در این مقاله با انجام چندین آزمایش مختلف روی مجموعه دادگان گفتاری TIMIT سعی شده است، نحوه استخراج ویژگی های عمیق گلوگاهی، برای انجام بازشناسی خودکار گفتار مورد بررسی قرار گیرد. همچنین جهت بررسی نوع ویژگی های گفتاری ورودی، آموزش بانظارت و تاثیر مشتقات زمانی ویژگی های ورودی آزمایش هایی انجام شده است. از آزمایش های انجام شده مشخص گردید ویژگی های گلوگاهی قادر هستند، در مقایسه با ویژگی های رایج گفتاری مانند MFCC حدود 7 درصد دقت بازشناسی را افزایش دهند. همچنین بهترین دقت بازشناسی از ویژگی های گلوگاهی مربوط به شبکه آموزش دیده بصورت با نظارت، با استفاده از ویژگی ها طیفی مبتنی بر معیار مل (MFSC)، با در نظر گرفتن ویژگی های مشتق زمانی، حاصل شده است.

کلیدواژه ها:

بازشناسی خودکار گفتار ، شبکه عصبی عمیق ، ویژگی های عمیق گلوگاهی

نویسندگان

امیرحسین حاج احمدی

آزمایشگاه پردازش هوشمند داده های چندرسانه ای، دانشکده مهندسی کامپبوتر، دانشگاه صنعتی امیرکبیر، تهران

محمدمهدی همایون پور

دانشیار، آزمایشگاه پردازش هوشمند داده های چندرسانه ای، دانشکده مهندسی کامپبوتر، دانشگاه صنعتی امیرکبیر، تهران