شناسایی و تقطیع همپوشانی گفتار گویندگان به کمک روشهای یادگیری ماشین و کاربرد آن در شاخص گذاری گفتار گویندگان
محل انتشار: پانزدهیمن کنفرانس مهندسی برق ایران
سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 3,001
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEE15_223
تاریخ نمایه سازی: 17 بهمن 1385
چکیده مقاله:
همپوشانی در گفتار به معنای وجود و تاثیر گفتار بیش از یک فرد در سیگنال صوتی به شکل همزمان است و معمولا در اثر نزدیکی منابع صوتی و یا اختلال در کانال انتقال گفتار روی میدهد. وجود همپوشانی در گفتار تاثیرات مخربی بر میزان شناسایی دارد و همچنین در ردیابی و تشخیص فعالیتهای گویندگان از اهمیت بالایی برخوردار است. در اکثر روشهایی که تاکنون برای ناسایی همپوشانی در گفتار پیشنهاد شده است. از ویژگیهایی مثل تناوب طیف، سیگنال گفتار برای این منظور استفاده شده است و کمتر از روشهایی برای یادگیری سیگنال گفتار همپوشان استفاده شده است. در این مقاله برخی از روشهای یادگیری ماشین مثل، شبکه های عصبی، ماشین بردار پشتیبان، دسته بندی کنندهk نزدیک ترین همسایه و همچنین مدل مخلوط گوسی برای مدلسازی و سپس تقطیع گفتار دارای همپوشانی مورد بررسی قرار گرفته است. نتایج حاصل از ارزیابی ها حکایت ازکارایی بسیار خوب روشهایی مانند SVM و GMM در شناسایی و تقطیع قطعات گفتاری دارای همپوشانی دارد.
کلیدواژه ها:
نویسندگان
محمدحسین معطر
آزمایشگاه سیستمهای هوشمند پردازش صوت و گفتار، دانشکده مهندسی کامپیو
محمدمهدی همایونپور
آزمایشگاه سیستمهای هوشمند پردازش صوت و گفتار، دانشکده مهندسی کامپیو
سعید شیری قیداری
آزمایشگاه سیستمهای هوشمند پردازش صوت و گفتار، دانشکده مهندسی کامپیو
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :