استخراج ویژگی مبتنی بر ترکیب ویژگیهای SSC و PLP جهت بهبود راندمان بازشناسی گوینده

  • سال انتشار: 1394
  • محل انتشار: هفتمین کنفرانس ملی مهندسی برق و الکترونیک ایران
  • کد COI اختصاصی: ICEEE07_136
  • زبان مقاله: فارسی
  • تعداد مشاهده: 852
دانلود فایل این مقاله

نویسندگان

مسعود قراچورلوئی

سازمان پژوهشهای علمی و صنعتی ایران تهران،ایران

غلامرضا فراهانی

دانشجوی کارشناسی ارشد، عضو هیئت علمی پژوهشکده برق و فناوری اطلاعات تهران،ایران

چکیده

در این مقاله میزان اهمیت ترکیب ویژگی ها جهت بهبود بازشناسی گوینده سنجیده شده است. برای این منظور نمونه های گفتار آموزشی و آزمایشی از کل دادگان TIMIT به نسبت 9 به 1 استخراج شده است. در ابتدا سکوت از گفتار گویندگان حذف و سپس جهت اعمال شرائط متفاوت آموزش و آزمایش، نسبت سیگنال به نویز فایل های صوتی به مقادیر 5- و 0 و 5 و 10 دسی بل تغییر داده شده است. ضرایب SSC و PLP از گفتار گویندگان استخراج و مدلهای GMM گویندگان ساخته شده و سپس آزمایش های تعیین هویت با دادگان تمیز و دادگان نویزی انجام پذیرفته است. در مقایسه بین ویژگی های مختلف برای بازشناسی گوینده، نتایج پیاده سازی نشان می دهد که ضرایب SSC از ویژگی دیگر در نسبت سیگنال به نویزهای مختلف، دارای نتایج بهتری است. همچنین ترکیب ویژگی های SSC و PLP مورد بررسی قرار گرفت که باعث افزایش راندمان بازشناسی گوینده به ترتیب به مقدار 1.8 و 2.9 درصد شده که نرخ بازشناسی گوینده به مقدار 98.9% رسیده است.

کلیدواژه ها

بازشناسی گوینده، مدل مخلوط گوسی، استخراج ویژگی، دادگان TIMIT

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.