دسته بندی گفتار و موسیقی بوسیله شبکه عصبی فازی - PSO با استفاده از بعد فراکتالی

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,272

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI14_227

تاریخ نمایه سازی: 26 مهر 1387

چکیده مقاله:

برای جداسازی گفتار از موسیقی روش های متفاوتی پیشنهاد شده و مورد استفاده قرار گرفته است. در این مقاله با پیشنهاد دو ویژگی برگرفته از بعد فراکتالی و استفاده از یک شبکه عصبی فازی و بهبود آن به کمک PSO نشان داده است که استفاده از این راهبرد نسبت به راهبردهای مشابه، که معمولا از تعداد ویژگی های زیادی برای دسته بندی استفاده می کنند، نتایج قابل قبولتری دارد. همچنین نشان داده شده است با استفاده از شبکه عصبی فازی می توان به نتایج بهتری نسبت به استفاده از روش های معمول همانند مدل مخلوط گوسی GMM با پیچیدگی یکسان با شبکه عصبی فازی، دست یافت.

کلیدواژه ها:

جداسازی گفتار از موسیقی ، دسته بندی ، شبکه عصبی فازی ، مدل مخلوط گوسی ، PSO ، ANFIS

نویسندگان

عباس یزدان پناه

آزمایشگاه سیستم های هوشمند صوتی-گفتاری دانشکده مهندسی کامپیوتر و فن

محمد مهدی همایون پور

آزمایشگاه سیستم های هوشمند صوتی-گفتاری دانشکده مهندسی کامپیوتر و فن