بدست آوردن همترازی زمانی بین متن و صوت با استفاده از ترکیب الگوریتم CTC و MarbelNetVAD
- سال انتشار: 1402
- محل انتشار: بیستمین سمپوزیوم بین المللی هوش مصنوعی و پردازش سیگنال
- کد COI اختصاصی: CDI20_020
- زبان مقاله: فارسی
- تعداد مشاهده: 230
نویسندگان
مرکز تحقیقات هوش مصنوعی
مرکز تحقیقات هوش مصنوعی پارت
چکیده
در این مقاله روشی جدید با استفاده از ترکیب الگوریتمهای طبقه بندی زمانی ارتباط گرا (CTC) و MarbelNetVAD به منظور برچسب زنی داده های صوتی در حالتی که علاوه بر کم بودن دادها، صوت متناظر با متن هم حالت استاندارد نداشته پیشنهاد شده است. از جمله این نوع دادها می توان به متن و صوت ادعیه مفاتیج الجنان اشاره کرد که تعداد محدودی دعا توسط چند مداح/گوینده با لحنی خاص خوانده شده است. در این روش با استفاده از الگوریتم CTC تخمین اولیه ای همترازی های زمانی، مبتنی بر توزیع احتمالی بدست آمده از یک مدل بازشناسی گفتار wav۲vec۲ بدست می آید. مشکل تخمین اولیه با توجه به نوع دادها این است که ممکن است صوت یک عبارت کوتاه از یک جمله در جمله دیگر تشخیص داده شود. از این رو، در ادامه با ترکیب خروجی CTC و زمانهای بدست آمده از MarbelNetVAD تخمین دقیقی از همترازی زمانی هر عبارت و صوت متناظر با آن در دنباله صوتی بدست می آید. نتایج حاصل از شبیه سازی ها نشان می دهد میانگین و واریانس اختلاف همترازی های زمانی تخمین زده شده توسط روش پیشنهادی در حدود ۰.۶۴s و ۰.۳۷ است، در عین حال که روش CTC به عنوان روش پایه به میانگین و واریانسی در حدود ۰.۸۷s و ۰.۴۷ رسیده است.کلیدواژه ها
همترازی زمانی، الگوریتم CTC، MarbelNetVAD..مقالات مرتبط جدید
- بهینه سازی مدیریت انرژی در ریزشبکه ها با استفاده از الگوریتم های هوش مصنوعی
- مبانی، کاربردها و چالشهای یادگیری مشارکتی و تحلیل تجربی و مقایسه ابزارهای یادگیری فدرالی در پیاده سازی مدلهای یادگیری ماشین
- راهکارهای مبتنی بر هوش مصنوعی برای بهره وری انرژی در تولید سیمان: یک بررسی جامع
- معماری اینترنت اشیا مبتنی بر هوش مصنوعی در مدیریت انرژی هوشمند
- سیستم های EMS/BMS در ساختمان های ZEB و نمونههای اجرا شده آن در سطح جهانی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.