تشخیص زبان گوینده با استفاده از ضرایب MFCC و روش دسته بندی ماشین بردار پشتیبان

  • سال انتشار: 1392
  • محل انتشار: همایش مهندسی برق و توسعه پایدار با محوریت دستاوردهای نوین در مهندسی برق
  • کد COI اختصاصی: EOESD01_166
  • زبان مقاله: فارسی
  • تعداد مشاهده: 2095
دانلود فایل این مقاله

نویسندگان

علی درگاهی

دانشجوی کارشناسی ارشد مهندسی برق،عضوباشگاه پژوهشگران جوان دانشگاه آزاد اسلامی واحد گناباد

جلیل شیرازی

استادیار گروه برق مخابرات دانشگاه آزاد اسلامی واحد گناباد

چکیده

در این مقاله شناسایی و دسته بندی 10 زبان مختلف از روی سیگنال گفتار زبان به صورت ناوابسته به گوینده، شامل زبانهای ترکی، اسپانیایی، روسی،پرتغالی، کره ای، ژاپنی، آلمانی، فرانسوی، چینی و عربی توسط دسته بندی کننده ماشین بردار پشتیبان انجام شده است. سیگنالهای گفتار زبان هر کلاس بهقابهای 20 میلی ثانیه تقسیم شده و برای هر قاب 13 ضریب MFCC 01 ضریب ، ΔMFCC به عنوان سرعت و 13 ضریب ΔΔMFCC به عنوان شتاب وهمچنین پارامتر ENERGY به عنوان انرژی قاب، ضریب ENERGY Δ به عنوان سرعت و ضریب ENERGY ΔΔ بعنوان شتاب،که در مجموع 42ضریب را تشکیل می دهند، به عنوان بردارهای ویژگی قاب استخراج و محاسبه شده است. دسته بندی و تشخیص 10 زبان را با استفاده از لیفترهای مختلف ودر شرایط متفاوت بررسی کرده و نتایج بدست آمده، نشان دهنده کارآیی بالای ویژگی های استفاده شده در تشخیص زبان های مورد استفاده در این تحقیقمی باشد.

کلیدواژه ها

تشخیص زبان گوینده، ماشین بردار پشتیبان، ضرایب MFCC ، لیفترینگ

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.