یک سیستم چند مرحله ای برای شاخص گذاری گوینده بصورت مستقل از کانال

  • سال انتشار: 1388
  • محل انتشار: پانزدهمین کنفرانس کامپیوتر سالانه انجمن کامپیوتر ایران
  • کد COI اختصاصی: CSICC15_247
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1119
دانلود فایل این مقاله

نویسندگان

طاهره امامی آزادی

پژوهشکده پردازش هوشمند علائم، تهران.

جهانشاه کبودیان

پژوهشکده پردازش هوشمند علائم، تهران.

چکیده

در این مقاله، یک سیستم چند مرحلهای برای شاخص گذاری گوینده، با قابلیت تخمین خودکار تعداد گوینده ها، به منظور استفاده درسیستمهای بازشناسی گوینده تلفنی و اینترنتی، ارائه میشود. درسیستم مذکور، در نخستین مرحله، پس از حذف سکوت از سیگنال صوتی، مرزهای تغییر گوینده با استفاده از معیار GLR تعیین میشود. در ادامه، قطعات کنار هم و متوالی، بر اساس شباهتی که با هم دارند،تلفیق میشوند. در مرحله بعد، با استفاده از خوشه بندی سلسله مراتبی، قطعات متعلق به هر گوینده در یک خوشه قرار میگیرند. این مراحل با اعمال مدل GMM برای هریک از خوشه ها و تقطیع مجدد سیگنال گفتار با الگوریتم ویتربی خاتمه مییابد. از سیستم ارائه شده برای تقطیع و شاخص گذاری گوینده در گفتار تلفنی استفاده به عمل آمد و خطای شاخص گذاری با معیار NIST یا همان DER به 7/9% رسید. پیاده سازیهای انجام شده روی چند مجموعه مختلف از دادگان، نشانگر مقاوم بودن سیستم ارائه شده نسبت به نوع کانال، نویز محیط وروشهای فشرده سازی با نرخ بیت متفاوت است.

کلیدواژه ها

شاخص گذاری گوینده، معیار بیز، تقطیع وخوشه بندی گوینده، مدل مخلوط گوسی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.