پردازش صوت با استفاده از الگوریتمهای هوش مصنوعی بهینه
محل انتشار: دهمین کنفرانس بین المللی پژوهش های نوین در مهندسی برق، کامپیوتر، مکانیک و مکاترونیک در ایران و جهان اسلام
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 20
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICECM10_088
تاریخ نمایه سازی: 1 مرداد 1404
چکیده مقاله:
پردازش صوت با هوش مصنوعی یکی از بخش های مهم در علم داده است که با جمع کردن داده های صوتی آن ها را پیش پردازش می کنیم و سپس ویژگی هایی که در آن صوت وجود دارد را استخراج کرده و در مرحله آخر یک مدل ساخته می شود که بتواند صداهارا متوجه شود و آن ها را تحلیل کند. شبکه های عصبی عمیق (DNN) و مدل Transformer به دلیل اینکه توانایی در یادگیری الگوهای پیچیده را دارند، دقت پردازش صوت را بسیار بالا برده اند که این تکنولوژی در تشخیص گفتار (مثل دستیارهای صوتی)، تولید گفتار مصنوعی، تشخیص احساسات انسان ها از صداهایشان و شناسایی موسیقی کاربرد زیادی دارد. برای بهتر شدن این کار لازم است که از مدل مناسب استفاده کنیم و بسیاری داده های مختلف را داشته باشیم. همین طور از یادگیری تقویتی استفاده کنیم و از چند کامپیوتر به صورت همزمان استفاده کنیم تا دقت و سرعت باالیی داشته باشیم. پردازش صوت از صنعت (مانند سیستم های پاسخگوی خودکار) تا علم (تحلیل داده های پزشکی) و حتی زندگی روزمره (مثل اپلیکیشن های ترجمه) را آسان کرده است.
کلیدواژه ها:
پردازش صوت ، هوش مصنوعی ، شبکه های عصبی عمیق ، مدل Transformer ، تشخیص گفتار ، تولید گفتار مصنوعی ، یادگیری تقویتی ، داده های مختلف
نویسندگان
نیما ربیعی
دکترای هوش مصنوعی دانشگاه آزاد اسلامی قم
ریحانه سعادتی
دانشجوی کاردانی رشته نرم افزار دانشگاه آزاد اسلامی یادگار امام (ره