پردازش صوت با استفاده از الگوریتمهای هوش مصنوعی بهینه

نیما ربیعی; ریحانه سعادتی

پردازش صوت با استفاده از الگوریتمهای هوش مصنوعی بهینه

محل انتشار: دهمین کنفرانس بین المللی پژوهش های نوین در مهندسی برق، کامپیوتر، مکانیک و مکاترونیک در ایران و جهان اسلام

سال انتشار: 1404

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 228

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2316062

شناسه ملی سند علمی:

ICECM10_088

تاریخ نمایه سازی: 1 مرداد 1404

چکیده مقاله:

پردازش صوت با هوش مصنوعی یکی از بخش های مهم در علم داده است که با جمع کردن داده های صوتی آن ها را پیش پردازش می کنیم و سپس ویژگی هایی که در آن صوت وجود دارد را استخراج کرده و در مرحله آخر یک مدل ساخته می شود که بتواند صداهارا متوجه شود و آن ها را تحلیل کند. شبکه های عصبی عمیق (DNN) و مدل Transformer به دلیل اینکه توانایی در یادگیری الگوهای پیچیده را دارند، دقت پردازش صوت را بسیار بالا برده اند که این تکنولوژی در تشخیص گفتار (مثل دستیارهای صوتی)، تولید گفتار مصنوعی، تشخیص احساسات انسان ها از صداهایشان و شناسایی موسیقی کاربرد زیادی دارد. برای بهتر شدن این کار لازم است که از مدل مناسب استفاده کنیم و بسیاری داده های مختلف را داشته باشیم. همین طور از یادگیری تقویتی استفاده کنیم و از چند کامپیوتر به صورت همزمان استفاده کنیم تا دقت و سرعت باالیی داشته باشیم. پردازش صوت از صنعت (مانند سیستم های پاسخگوی خودکار) تا علم (تحلیل داده های پزشکی) و حتی زندگی روزمره (مثل اپلیکیشن های ترجمه) را آسان کرده است.

کلیدواژه ها:

پردازش صوت ، هوش مصنوعی ، شبکه های عصبی عمیق ، مدل Transformer ، تشخیص گفتار ، تولید گفتار مصنوعی ، یادگیری تقویتی ، داده های مختلف

نویسندگان

نیما ربیعی

دکترای هوش مصنوعی دانشگاه آزاد اسلامی قم

ریحانه سعادتی

دانشجوی کاردانی رشته نرم افزار دانشگاه آزاد اسلامی یادگار امام (ره