طراحی سیستم هوشمند لب خوانی با ارائه روش جدید استخراج ویژگی مبتنی بر تحلیل یک بعدی تصویر
محل انتشار: کنفرانس بین المللی مهندسی برق
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,271
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICELE01_394
تاریخ نمایه سازی: 21 شهریور 1395
چکیده مقاله:
موضوع بازشناسی دیداری گفتار یا همان لب خوانی خودکار، اخیراً یکی از بحث های مهم در زمینه طراحی سیستم های هوشمند تشخیص گفتار می باشد. در همین راستا یکی از دغدغه ها و بحث های مطالعات مختلف انجام شده در این زمینه، موضوع فرآیند و چگونگی استخراج ویژگی می باشد. مشکل اساسی در روش های کنونی، ابعاد بالای ویژگی ها و عدم مقاوم بودن آنها در شرایط مختلف روشنایی محیطی و نویزی می باشد. لذا در این مقاله روش استخراج ویژگی جدیدی مبتنی بر بررسی پارامترهای سیگنالی تصویر ناحیه لب، پیشنهاد شده است. در این روش با تغییر رویکرد نگرش به تصویر، ماهیت آن را همانند سیگنال یک بعدی فرض کرده و پارامتر های تبدیل فوریه گسسته آن استخراج شده و از آن به عنوان ویژگی استفاده می گردد. بر طبق نتایج آزمایش های انجام شده در این تحقیق صحت تشخیص درست 91% بدست آمد که گواهی بر کارایی و انعطاف پذیری بالای این روش می باشد.
کلیدواژه ها:
لب خوانی ، بازشناسی دیداری گفتار ، استخراج ویژگی ، تبدیل فوریه گسسته ، شبکه های عصبی مصنوعی ، پردازش تصویر
نویسندگان
حجت فلاح
فارغ التحصیل کارشناسی ارشد مهندسی پزشکی، دانشکده مهندسی پزشکی، دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران، ایران
سیدکمال الدین ستاره دان
دانشیار، گروه بیوالکتریک، دانشکده مهندسی برق، دانشگاه تهران، تهران، ایران
علی مطیع نصرآبادی
دانشیار، گروه بیوالکتریک، دانشکده مهندسی پزشکی، دانشگاه شاهد، تهران، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :