افزایش دقت تشخیص خودکار زبان با استفاده از ویژگی های طیفی و شبکه عصبی WRBF

  • سال انتشار: 1393
  • محل انتشار: دومین همایش ملی مهندسی برق ایران
  • کد COI اختصاصی: INCEE02_091
  • زبان مقاله: فارسی
  • تعداد مشاهده: 675
دانلود فایل این مقاله

نویسندگان

محمد احدنژاد

دانشگاه آزاد اسلامی واحد قائمشهر، گروه برق، قائمشهر، ایران

مهرداد احمدی کمرپشتی

دانشگاه آزاد اسلامی واحد جویبار، گروه برق، جویبار، ایران

محمدظاهر قربانی جویباری

شرکت توزیع نیروی برق مازندران، ساری، ایران

امید ذبیحی افراکتی

شرکت توزیع نیروی برق مازندران، ساری، ایران

چکیده

شناسایی خودکار زبان گفتاری حوزه ی مهمی از پردازش گفتار است. منظور از شناسایی خودکار زبان، توانایی ماشین در تعیین زبان گفتاری می باشد. تاکنون تحقیقات زیادی در زمینه ی تشخیص خودکار زبان انجام شده است که در اکثر این تحقیقات ویژگی استخراج شده از سیگنال گفتار، ضرایب PLP یا MFCC بوده است. در این تحقیق یک سیستم جدید تشخیص گفتار معرفی شده است که استخراج ویژگی آن بر مبنای ضرایب تبدیل فوریه ی بسل بوده و در بخش کلاسه بندی آن، از شبکه ی عصبی جدید WRBF استفاده شده است. نتایج بدست آمده از سیستم جدید، با نتایج حاصله از روش های معروف استخراج ویژگی PLP و MFCC و همچنین شبکه های عصبی MLP و RBF مقایسه شده است. نتایج آزمایشات انجام شده برای پایگاه داده ی OGI نشان می دهد که شبکه ی WRBF دقت تشخیص زبان را به ترتیب، به میزان 8% و 6% و 7% بر روی ویژگی های پیشنهاد شده ی تبدیل فوریه ی بسل و MFCC و PLP افزایش می دهد.

کلیدواژه ها

شبکه عصبی، شناسایی زبان،MFCC, PLP

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.