گسترش پهنای باند گفتار باند باریک بر اساس لگاریتم انرژی فیلتر بانک

  • سال انتشار: 1390
  • محل انتشار: هجدهمین کنفرانس مهندسی پزشکی ایران
  • کد COI اختصاصی: ICBME18_093
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1392
دانلود فایل این مقاله

نویسندگان

سارا پورمحمدی

دانشجوی دانشگاه شاهد

منصور ولی

استادیار دانشگاه شاهد

محسن قدیانی

دانشجوی دانشگاه شاهد

جهانشاه کبودیان

استادیار دانشگاه رازی

چکیده

مدل ترکیب گوسی (GMM) از جمله کاراترین روش های مورد استفاده برای گسترش پهنای باند (BWE) سیگنال گفتار به شمار می رود. امروزه با وجود پیشرفت چشمگیر در فن آوری ارتباطات، محدودیت های موجود در پهنای باند انتقال شبکه های تلفنی موجب کاهش کیفیت و ا دراک پذیری سیگنال گفتار می گردد. گسترش پهنای باند، مؤلفه های نیمه بالایی طیف را به گفتار باند محدود تلفنی اضافه می کند و در اثر بازسازی سیگنال باند گسترده، قابلیت ادراک گفتار افزایش قابل قبولی خواهد یافت. در تحقیق حاضر فرض بر این است که همبستگی خوبی بین مؤلفه های طیفی باند پائین با بخش های بالایی طیف گفتار وجود دارد. در این مقاله از روش GMM برای تخمین پوش طیف استفاده شده است. پارامترهای بازنمایی مورد استفاده برای بازتولید ضرایب فیلتر لوله صوتی، لگاریتم انرژی فیلتر بانک مل (LFBE)- که استفاده از آن در گسترش پهنای باند متداول نبوده- و ضرایب گسترال فرکانسی مقیاس مل (MFCC) می باشند. ارزیابی های عینی به دست آمده از پیاده سازی ها بیانگر آن است که با استفاده از هر دو دسته این پارامترها نتایج قابل قبولی به دست می آید اما بردارهای بازنمایی LFBE در مقایسه با MFCC عملکرد بهتری دارند.

کلیدواژه ها

پوش طیف، گفتار باند گسترده، گفتار باند محدود، گسترش مصنوعی پهنای باند، مدل ترکیب گوسی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.