دسته بندی رویدادهای صوتی با استفاده از ویژگی های MFCC و معماری ResNet-50
- سال انتشار: 1398
- محل انتشار: ششمین کنفرانس ملی پژوهش های کاربردی در مهندسی کامپیوتر و فناوری اطلاعات
- کد COI اختصاصی: CEPS06_196
- زبان مقاله: فارسی
- تعداد مشاهده: 632
نویسندگان
گروه سیستم های الکترونیک دیجیتال، دانشکده مهندسی برق، دانشگاه علم و صنعت، تهران، ایران
گروه سیستم های الکترونیک دیجیتال، دانشکده مهندسی برق، دانشگاه علم و صنعت، تهران، ایران
چکیده
از یک دیدگاه، هدف آشکارسازی رویداد صوتی برچسب گذاری محدوده های زمانی یک صدای ضبط شده است که یک توصیف نمادین را نتیجه می دهد و هر توصیف، زمان شروع، زمان پایان و یک برچسب برای نمونه واحد از یک اتفاق خاص را نشان می دهد. این تعریف، به رونویسی موزیک و هم چنین شناسایی گوینده مربوط می شود که به طور مشابه یک نشانه گذاری ساختاری از قطعه های زمانی را پوشش می دهد، و بیشتر بر تبدیلات گفتار تمرکز دارد تا رویدادهای منفرد صوتی. هدف از انجام این پژوهش انجام دسته بندی رویدادهای صوتی با استفاده از ویژگی های MFCC و معماری ResNet-50 بوده است. نتایج حاصل از پژوهش نشان می دهد که بهترین شبکه های عصبی در حوزه تصویر می توانند نتایجی عالی در طبقه بندی صوت نیز به دست آورند. هم چنین می توان گفت تغییر در مقدار نرخ یادگیری می تواند منجر به بهبود فرایند آموزش شود.کلیدواژه ها
رویداد صوتی، از ویژگی MFCC، معماری ResNet-50مقالات مرتبط جدید
- کارآفرینی در کتابخانه های عمومی با راه اندازی خدمات مشاوره اطلاعاتی و مشاوره خوانندگان
- متاورس: مباحثی از فرصت های حرفه ای و مشاغل در گستره فناوری نوین
- بررسی معماری و بلوغ کسب و کار رایانش ابری بر مبنای مدیریت امنیت اطلاعات در علم اطلاع شناسی (مطالعه موردی شرکت های دانش بنیان پارک فناوری ارتباطات و اطلاعات)(چارچوب همکاری های بین رشته ای و فرا رشته ای برای کارآفرینی دانش بنیان)
- ایجاد سازمان نظام مدیریت اطلاعات و دانش (نماد)
- لزوم توجه به فرصت های جدید بازارکار در محتوای درسی رشته علم اطلاعات و دانش شناسی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.