دسته بندی محیط صوتی مبتنی بر ویژگی ترکیبی جدید و حافظه طولانی - کوتاه مدت دوطرفه

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 372

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCT11_047

تاریخ نمایه سازی: 18 اردیبهشت 1400

چکیده مقاله:

دسته بندی محیط صوتی، شناسایی نوع محیط آکوستیکی از روی صداهای موجود در آن است که در زمینه های متعددی، همچون مراقبت های امنیتی، بازیابی اطلاعات از محتوای چندرسانه ای و غیره، کاربرد دارد. در اغلب پژوهش های انجام شده در این زمینه، از ویژگی های مبتنی بر تبدیل فوریه زمان کوتاه، مانند ضرایب کپسترال فرکانسی مل (MFCC) و اسپکتوگرام مل به عنوان ورودی طبقه بندی کننده استفاده شده است. در این مقاله، ویژگی جدیدی از ترکیب ویژگی های صوتی ضرایب کپسترال فرکانسی گاماتون (GFCC) و ضرایب کپسترال نرمالیزه شده توان (PNCC) به همراه مشتقات مرتبه اول و دوم آن ها به منظور طبقه بندی محیط صوتی پیشنهاد می شود. به منظور دسته بندی، از شبکه های عصبی حافظه طولانی - کوتاه مدت دوطرفه (BiLSTM) و پرسپترون چندلایه (MLP) استفاده می شود. نتایج، حاکی از عملکرد بهتر ویژگی ترکیبی پیشنهادی، با ساختار BiLSTM، نسبت به سایر روش های استخراج ویژگی است. بالاترین خروجی طبقه بندی مربوط به استفاده از ویژگی ترکیبی حاصل از GFCC و مشتقات اول و دوم آن با PNCC با درصد صحت ۷۹/۹ است.

کلیدواژه ها:

دسته بندی محیط صوتی ، ضرایب کپسترال فرکانسی گاماتون ، ضرایب کپسترال نرمالیزه شده توان ، حافظه طولانی - کوتاه مدت دوطرفه ، شبکه عصبی پرسپترون چندلایه

نویسندگان

مسعود گراوانچی زاده

گروه مهندسی پزشکی، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

سپیده اختری خسروشاهی

گروه مهندسی پزشکی، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

سحر ذاکری

گروه مهندسی پزشکی، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران