بازشناسی گفتار از موزیک در پخش رادیویی به روش ماشین بردار پشتیبان

  • سال انتشار: 1382
  • محل انتشار: اولین کنفرانس بین المللی فناوری اطلاعات و دانش
  • کد COI اختصاصی: ICIKT01_035
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1219
دانلود فایل این مقاله

نویسندگان

محمدمهدی همایون پور

استادیار دانشکده مهندسی کامپیوتر و فناوری اطلاعات

سید حسین خاتون آبادی

کارشناسی ارشد مهندسی کامپیوتر

چکیده

در سالهای اخیر روش نوین ماشین بردار پشتیبان(SVM) برای شناسایی و دسته بندی الگو به فراوانی مورد استفاده قرار گرفته است. نتایج حاصل از بکارگیری این روش در کاربردهای متفاوت حاکی از کارایی بالای این روش دارد. در مواردی چون برنامه های رادیویی و تلویزیونی که گفتار و موزیک تواما پخش می شوند و به دلایلی چون ذخیره سازی و مانند آن مایل به جداسازی گفتار از موزیک هستیم، نیاز به سیستمی که بتواند بطور خودکار بازشناسی گفتار از موزیک را انجام دهد احساس می شود. در این تحقیق بازشناسی گفتار از موزیک در پخش رادیویی به روش ماشین بردار پشتیبان مورد مطالعه قرار گرفته است. برای این منظور ویژگیهای ضرایب کپسترال حاصل از ضرایب پیشگویی خطی(LPCC) ، ضرایب کپسترال مبتنی بر معیار مل (MFCC) و مشتقات اول آنها آزمایش شده اند. نتایج بدست آمده بیانگر کارایی بالای تکنیک ماشین بردار پشتیبان در بازشناسی گفتار از موزیک و نیز بهتر بودن مشتق اول ضرایب کپسترال نسبت به خود آنها در این کاربرد می باشد.

کلیدواژه ها

بازشناسی گفتار از موزیک- ماشین بردار پشتیبان- ضرایب پیشگویی خطی- معیار مل

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.