استخراج ویژگیهای مبتنی بر خوشه بندی در فضای طیفی-زمانی با استفاده از شبکه عصبی

خدیجه, حسین پور; نفیسه, اسفندیان; مهرداد, هاشمی کمانگر

استخراج ویژگیهای مبتنی بر خوشه بندی در فضای طیفی-زمانی با استفاده از شبکه عصبی

عنوان مقاله: استخراج ویژگیهای مبتنی بر خوشه بندی در فضای طیفی-زمانی با استفاده از شبکه عصبی
شناسه ملی مقاله: CEPS04_001
منتشر شده در چهارمین کنفرانس بین المللی پژوهش های کاربردی درمهندسی کامپیوتر و پردازش سیگنال در سال 1395

مشخصات نویسندگان مقاله:

خدیجه حسین پور - دانشجوی کارشناسی ارشد هوش مصنوعی و رباتیک موسسه آموزش عالی علوم و فناوری آریان، بابل،ایران
نفیسه اسفندیان - گروه مهندسی برق، واحد قائمشهر، دانشگاه آزاد اسلامی، قایمشهر، ایران
مهرداد هاشمی کمانگر - گروه مهندسی برق، دانشگاه غیردولتی غیرانتفاعی شمال، آمل، ایران

خلاصه مقاله:

یکی از روشهای بازنمایی سیگنال گفتار، بازنمایی طیفی-زمانی گفتار با استفاده از مدل شنیداری میباشد. این مدل بر اساس شبیهسازی بخشهای گوش داخلی و اولین لایه بخش شنوایی مغز ارایه شده است. این مدل، نمایشی چندبعدی از ویژگیهای طیفی و زمانی سیگنالهای گفتار ارایه میدهد. در واقع، خروجی این مدل، آرایهای چندبعدی است که اطلاعات را در امتداد چهار بعد زمان، فرکانس، نرخ و مقیاس نمایش میدهد. در نتیجه به دلیل بزرگبودن ابعاد فضای ویژگیهای طیفی-زمانی، استفاده از روشی برای کاهش ابعاد بردار ویژگی در این فضا ضروری میباشد. در تحقیقاتی که اخیرا0 انجام شده است، به منظور استخراج بخشهای اصلی گفتار، فضای ویژگیهای اولیه در مدل طیفی-زمانی با استفاده از روشهای مانند مدل مخلوط گوسی(GMM(و K-میانگین وزندار(WKM(خوشهبندی گردیده است. لکن بالابودن هزینه محاسباتی این روشها، موجب محدودیت استفاده از آنها در کاربردهای وسیعتر میگردد. لذا رویکرد اصلی این مقاله، استفاده از یک روش مناسب برای خوشهبندی فضای طیفی-زمانی میباشد. با توجه به عملکرد مناسب شبکه عصبی برای خوشهبندی دادههای چندبعدی، در این مقاله، از شبکه عصبی غیرنظارتی SOM برای خوشهبندی فضای طیفی-زمانی استفاده میشود. نتایج نشان میدهد که در کلیه زیرگروههای واجهای صدادار و بیصدا، خطای طبقهبندی با استفاده از ویژگیهای ثانویه پیشنهادی نسبت به ویژگیهای مبتنی بر خوشهبندی K-میانگین وزندار ، بهبود یافته است. نتایج حاصل از ویژگیهای جدید نشان میدهد که به طور متوسط، خطای سیستم نسبت به ویژگیهای مبتنی بر خوشهبندی WKM ،15/24 % جبران شده است.

کلمات کلیدی:

ویژگیهای طیفی-زمانی، مدل شنیداری، خوشهبندی، شبکه عصبی مصنوعی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/617006/