تشخیص نواحی صدادار، بی صدا و سکوت سیگنال گفتار با استفاده از روش استخراج ویژگی مبتنی بر خوشه بندی در فضای طیفی- زمانی

  • سال انتشار: 1397
  • محل انتشار: دومین کنفرانس بین المللی فناوری های نوین در علوم
  • کد COI اختصاصی: CMTS02_150
  • زبان مقاله: فارسی
  • تعداد مشاهده: 432
دانلود فایل این مقاله

نویسندگان

فاطمه جهانی بهنمیری

گروه مهندسی کامپیوتر، واحد امیرکلا، موسسه آموزش عالی آریان، بابل، ایران

نفیسه اسفندیان

گروه مهندسی برق، واحد قائمشهر، دانشگاه آزاد اسلامی، قائمشهر، ایران

سودابه حبیبی بائی

گروه مهندسی برق، واحد امیرکلا، موسسه آموزش عالی آریان، بابل، ایران

چکیده

یکی از روش های بازنمایی سیگنال گفتار، بازنمایی طیفی- زمانی گفتار با استفاده از مدل شنیداری می باشد. در این مقاله، از روش های مبتنی بر خوشه بندی فضای طیفی- زمانی، برای بخش بندی گفتار استفاده می شود. در این روش، با استفاده از خوشه بندی مدل WK- Means ، بردارهای میانگین و واریانس مراکز خوشه ها به عنوان ویژگی های ثانویه در هر قاب استخراج می شود. با توجه به اینکه بخش های صدادار نسبت به بخش های بی صدا انرژی بیشتری دارد، در مرحله نخست از میانگین انرژی خوشه اول برای بخش بندی سیگنال گفتار استفاده شده است در این روش برای تفکیک نواحی صدادار، بی صدا و سکوت گفتار، از دو آستانه استفاده شده است. مقادیر این آستانه ها به صورت تجربی به دست آمده و برای تمامی جملات استفاده شده است. به منظور افزایش دقت بخش بندی، ویژگی های دیگر همچون، اختلاف انرژی خوشه اول و سوم و مینیمم مقدار تابع همبستگی نرمالیزه شده خوشه ها در طول قاب های متوالی با میانگین انرژی خوشه اول استفاده شد. در این مرحله، سیستم بخش بندی گفتار به دقت کلی 88/34% دست یافت. نتایج بخش بندی گفتار به دقت 66/66 % دست یافته است و خطای سیستم پیشنهادی نسبت به روش های موجود کاهش یافته است.

کلیدواژه ها

ویژگی های طیفی- زمانی، مدل شنیداری، خوشه بندی، k میانگین وزندار

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.