کشف و رده بندی وقایع صوتی محیطی با استفاده از نگاشت سگمنت بر دیکشنری در نمایش تنک

سال انتشار: 1397
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 431

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_TJEE-48-4_010

تاریخ نمایه سازی: 22 تیر 1398

چکیده مقاله:

در اینجا کشف و رده بندی وقایع صوتی محیطی با استفاده از نگاشت سگمنت بر دیکشنری در نمایش تنک مورد پژوهش قرار گرفته است. یکی از مشکلات رویکردهای مبتنی بر دیکشنری، نبود کنترل لازم در نحوه نگاشت سگمنت های ورودی بر  بردارهای پایه دیکشنری جهت شناسایی صدای موجود در سگمنت است. این عدم کنترل، سبب تجزیه سگمنت به تعدادی از اصوات کوچک که بخش های سگمنت هستند می شود. در اینجا الگوریتمی جهت کنترل صریح نگاشت هر سگمنت بر بردارهای پایه دیکشنری پیشنهاد شده است که از طریق به کارگیری تابع انحراف-بتا و کنترل تنکی تجزیه نامنفی دنبال می شود و کل سگمنت را به عنوان یک واقعه صوتی شناسایی می کند. در عمل با کنترل میزان تنکی، هر سگمنت با مجموع چند بردار پایه تقریب زده می شود به طوری که کل سگمنت یکجا شناسایی شود. این الگوریتم در مراحل تست جهت شناسایی صداهای محیط اداری بکار رفته و نتایج به دست آمده گویای رشد نرخ شناسایی صداها می باشد که تاییدی بر موثر بودن روش پیشنهادی است.

نویسندگان

مراد درخشان

دانشکده مهندسی کامپیوتر و فناوری اطلاعات - دانشگاه صنعتی شاهرود

حسین مروی

دانشکده مهندسی کامپیوتر و فناوری اطلاعات - دانشگاه صنعتی شاهرود

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • مسعود گراوانچی زاده و صنم ایمانی شاملو، جداسازی تک گوشی ... [مقاله ژورنالی]
  • مسعود گراوانچی زاده و پریا دادور، تخمین SNR ورودی با ... [مقاله ژورنالی]
  • T. Heittola, A. Mesaros, T. Virtanen, and A. Eronen, Sound ...
  • R. Hennequin, R. Badeau and B. David, NMF with Time–Frequency ...
  • Y. Ohishi, D. Mochihashi, T. Matsui, M. Nakano, H. Kameoka, ...
  • X. Lu, Y. Tsao, S. Matsuda and C. Hori, Sparse ...
  • E. Benetos, G. Lafay, M. Lagrange, and M. Plumbley, Detection ...
  • T. Komatsu, Y. Senda, and R. Kondo, Acoustic event detection ...
  • D. Stowell, D. Giannoulis, E. Benetos, M. Lagrange, and M.D. ...
  • I. Choi, K. Kwon, S. Hyun Bae, and N, Soo ...
  • J. F. Gemmeke, L. Vuegen, P. Karsmakers, B. Vanrumste, and ...
  • A. Cont, Realtime multiple pitch observation using sparse non-negative constraints, ...
  • A. Cont, S. Dubnov, D. Wessel, Realtime multiple-pitch and multiple-instrument ...
  • S. Innami and H. Kasai, NMF-based environmental sound source separation ...
  • M. W. Berry, M. Browne, A. Langville, V. P. Pauca, ...
  • A. Cichocki, R. Zdunek, A. H. Phan, and S. Amari, ...
  • C. Fevotte, and J. Idier, Algorithms for nonnegative matrix factorization ...
  • M. Nakano, H. Kameoka, J. Le Roux, Y. Kitano, N. ...
  • D. L. Sun, C. Fevotte, Alternating direction method of multipliers ...
  • S. Boyd, L. Vandenberghe: Convex Optimization, Cambridge University Press, Cambridge, ...
  • F. Sha, Y. Lin, L. K. Saul, and D. D. ...
  • M. Shashanka, B. Raj, P. Smaragdis, Probabilistic latent variable models ...
  • L. Vuegen, B. Van Den Broeck, P. Karsmakers, J. F. ...
  • Music Information Retrieval Evaluation eXchange (MIREX): Multiple Fundamental Frequency Estimation ...
  • T. Heittola, M. Annamarie, sed_eval, Evaluation toolbox for online: https://github.com/TUT-ARG/sed_eval, ...
  • نمایش کامل مراجع