تشخیص نواحی فعال سیگنال گفتار با استفاده از روش استخراج ویژگی مبتنی بر خوشه بندی در فضای طیفی- زمانی

  • سال انتشار: 1397
  • محل انتشار: دومین کنفرانس بین المللی فناوری های نوین در علوم
  • کد COI اختصاصی: CMTS02_139
  • زبان مقاله: فارسی
  • تعداد مشاهده: 622
دانلود فایل این مقاله

نویسندگان

فاطمه جهانی بهنمیری

گروه مهندسی کامپیوتر، واحد بابل، موسسه آموزش عالی آریان، بابل، ایران

نفیسه اسفندیان

گروه مهندسی برق، واحد قائمشهر، دانشگاه آزاد اسلامی، قائمشهر، ایران

سمیرا مودتی

مهندسی برق، دانشکده فنی مهندسی، دانشگاه مازندران، بابلسر، ایران

چکیده

هدف اصلی در این تحقیق، استفاده از ویژگی های طیفی- زمانی استخراج شده از مدل شنیداری برای تشخیص نواحی فعال گفتار می باشد. هدف پژوهش این است که پس از بررسی روش های موجود برای تشخیص نواحی فعال گفتار، یک روش جدید بر اساس خوشه بندی مدل مخلوط گوسی در فضای طیفی زمانی پیشنهاد گردد. پس از بررسی دقیق این روش، کارایی آن در تشخیص نواحی فعال گفتار مورد ارزیابی قرار می گیرد. در این زمینه به منظور استخراج ویژگی های طیفی زمانی سیگنال گفتار از مدل شنیداری استفاده می شود. در این تحقیق نمایشی چند بعدی از ویژگی های طیفی- زمانی، برای سیگنال گفتار ارائه می شود که دارای چهار بعد زمان، فرکانس، سرعت و مقیاس می باشد. برای کاهش ابعاد فضای ویژگی های طیفی- زمانی، از روش های استخراج ویژگی مبتنی بر خوشه بندی مدل مخلوط گوسی و میانگین وزن دار انرژی استفاده می شود واز مولفه های بردارهای میانگین و واریانس خوشه ها، به عنوان ویژگی های ثانویه در بردارهای ویژگی استفاده می شود. سپس با استفاده از این بردارهای ویژگی ثانویه و تعیین آستانه بروز رسانی شده در هر قاب نواحی فعال گفتار تشخیص داده می شود. در این تحقیق سعی شده است تا با نظر گرفتن خوشه اول انرژی به عنوان خوشه اصلی گفتار محاسبات انجام گرفته و نتیجه گیری شود.

کلیدواژه ها

تشخیص نواحی فعال گفتار، ویژگی های طیفی- زمانی، مدل شنیداری، خوشه بندی مخلوط گوسی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.