پردازش صوت با استفاده از الگوریتمهای هوش مصنوعی بهینه
- سال انتشار: 1404
- محل انتشار: دهمین کنفرانس بین المللی پژوهش های نوین در مهندسی برق، کامپیوتر، مکانیک و مکاترونیک در ایران و جهان اسلام
- کد COI اختصاصی: ICECM10_088
- زبان مقاله: فارسی
- تعداد مشاهده: 27
نویسندگان
دکترای هوش مصنوعی دانشگاه آزاد اسلامی قم
دانشجوی کاردانی رشته نرم افزار دانشگاه آزاد اسلامی یادگار امام (ره
چکیده
پردازش صوت با هوش مصنوعی یکی از بخش های مهم در علم داده است که با جمع کردن داده های صوتی آن ها را پیش پردازش می کنیم و سپس ویژگی هایی که در آن صوت وجود دارد را استخراج کرده و در مرحله آخر یک مدل ساخته می شود که بتواند صداهارا متوجه شود و آن ها را تحلیل کند. شبکه های عصبی عمیق (DNN) و مدل Transformer به دلیل اینکه توانایی در یادگیری الگوهای پیچیده را دارند، دقت پردازش صوت را بسیار بالا برده اند که این تکنولوژی در تشخیص گفتار (مثل دستیارهای صوتی)، تولید گفتار مصنوعی، تشخیص احساسات انسان ها از صداهایشان و شناسایی موسیقی کاربرد زیادی دارد. برای بهتر شدن این کار لازم است که از مدل مناسب استفاده کنیم و بسیاری داده های مختلف را داشته باشیم. همین طور از یادگیری تقویتی استفاده کنیم و از چند کامپیوتر به صورت همزمان استفاده کنیم تا دقت و سرعت باالیی داشته باشیم. پردازش صوت از صنعت (مانند سیستم های پاسخگوی خودکار) تا علم (تحلیل داده های پزشکی) و حتی زندگی روزمره (مثل اپلیکیشن های ترجمه) را آسان کرده است.کلیدواژه ها
پردازش صوت, هوش مصنوعی, شبکه های عصبی عمیق, مدل Transformer, تشخیص گفتار, تولید گفتار مصنوعی, یادگیری تقویتی, داده های مختلفاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.