ارزیابی صوت با روش MFCC ماشین بردار پشتیبان و بهینه سازی آن

  • سال انتشار: 1395
  • محل انتشار: اولین کنفرانس ملی فناوری های نوین در مهندسی برق و کامپیوتر
  • کد COI اختصاصی: ICTI01_046
  • زبان مقاله: فارسی
  • تعداد مشاهده: 820
دانلود فایل این مقاله

نویسندگان

امید خواجه

دانشجوی کارشناسی ارشد مهندسی برق الکترونیک موسسه غیرانتفاعی فخرالدین اسعد گرگانی

مرتضی احمدی

هییت علمی موسسه فخرالدین اسعد گرگانی

چکیده

تشخیص الفبا از زیرشاخههای تشخیص گفتار است و از دیر باز در علوم مختلف بکار برده میشود و حوزه وسیعی از تحقیق را برای محققان فراهم نموده است. پردزش صدا شامل تلفظ توسط یک انسان یا ماشین انسان نما و سپس بازیابی توسط یک رایانه صورت می گیرد. برای تشخیص الفبا روشهای زیادی پیشنهاد شده است. در این مقاله روشهای متفاوتی در مورد استخراج ویژگی و دسته بندی الفبا با تلفیق از نوعی از الگوریتمها داریم .در این مقوله مشکلاتی نیز پیشرو داریم از جمله این مشکلات میتوان به مجموعه E-set اشاره کرد این مجموعه شامل حروف Z و B ،C ،D ،E ،G ،P ،T ،V میباشد مشکل این مجموعه شبیه بودن واج آوایی E در همه این حروف است که باعث مشکل شدن تشخیص این مجموعه می شود همچنین در این رابطه می توان واج ارایی بدست آمده را توسط الگوریتم کالمن بهینه سازی نمود. در این مقاله با استفاده از روش استخراج ویژگی MFCC و روش طبقه بندی SVM به نتایج مطلوبی دست پیدا کردیم.

کلیدواژه ها

E-set, Mel-frequency coefficients, (MFCC), Support Vector Machines(SCMs)

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.