بررسی تاثیر نوع ویژگی های گفتاری، مشتقات زمانی و برچسب های واجی در استخراج ویژگی های عمیق گلوگاهی
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 596
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI22_012
تاریخ نمایه سازی: 13 شهریور 1396
چکیده مقاله:
با توجه به اهمیت استفاده از شبکه های عصبی عمیق در بازشناسی خودکار گفتار، در این مقاله با انجام چندین آزمایش مختلف روی مجموعه دادگان گفتاری TIMIT سعی شده است، نحوه استخراج ویژگی های عمیق گلوگاهی، برای انجام بازشناسی خودکار گفتار مورد بررسی قرار گیرد. همچنین جهت بررسی نوع ویژگی های گفتاری ورودی، آموزش بانظارت و تاثیر مشتقات زمانی ویژگی های ورودی آزمایش هایی انجام شده است. از آزمایش های انجام شده مشخص گردید ویژگی های گلوگاهی قادر هستند، در مقایسه با ویژگی های رایج گفتاری مانند MFCC حدود 7 درصد دقت بازشناسی را افزایش دهند. همچنین بهترین دقت بازشناسی از ویژگی های گلوگاهی مربوط به شبکه آموزش دیده بصورت با نظارت، با استفاده از ویژگی ها طیفی مبتنی بر معیار مل (MFSC)، با در نظر گرفتن ویژگی های مشتق زمانی، حاصل شده است.
کلیدواژه ها:
نویسندگان
امیرحسین حاج احمدی
آزمایشگاه پردازش هوشمند داده های چندرسانه ای، دانشکده مهندسی کامپبوتر، دانشگاه صنعتی امیرکبیر، تهران
محمدمهدی همایون پور
دانشیار، آزمایشگاه پردازش هوشمند داده های چندرسانه ای، دانشکده مهندسی کامپبوتر، دانشگاه صنعتی امیرکبیر، تهران