طراحی سیستم هوشمند لب خوانی با ارائه روش جدید استخراج ویژگی مبتنی بر تحلیل یک بعدی تصویر

حجت فلاح; سیدکمال الدین ستاره دان; علی مطیع نصرآبادی

طراحی سیستم هوشمند لب خوانی با ارائه روش جدید استخراج ویژگی مبتنی بر تحلیل یک بعدی تصویر

محل انتشار: کنفرانس بین المللی مهندسی برق

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,271

فایل این مقاله در 12 صفحه با فرمت PDF و WORD قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > پردازش تصویر

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/504236

شناسه ملی سند علمی:

ICELE01_394

تاریخ نمایه سازی: 21 شهریور 1395

چکیده مقاله:

موضوع بازشناسی دیداری گفتار یا همان لب خوانی خودکار، اخیراً یکی از بحث های مهم در زمینه طراحی سیستم های هوشمند تشخیص گفتار می باشد. در همین راستا یکی از دغدغه ها و بحث های مطالعات مختلف انجام شده در این زمینه، موضوع فرآیند و چگونگی استخراج ویژگی می باشد. مشکل اساسی در روش های کنونی، ابعاد بالای ویژگی ها و عدم مقاوم بودن آنها در شرایط مختلف روشنایی محیطی و نویزی می باشد. لذا در این مقاله روش استخراج ویژگی جدیدی مبتنی بر بررسی پارامترهای سیگنالی تصویر ناحیه لب، پیشنهاد شده است. در این روش با تغییر رویکرد نگرش به تصویر، ماهیت آن را همانند سیگنال یک بعدی فرض کرده و پارامتر های تبدیل فوریه گسسته آن استخراج شده و از آن به عنوان ویژگی استفاده می گردد. بر طبق نتایج آزمایش های انجام شده در این تحقیق صحت تشخیص درست 91% بدست آمد که گواهی بر کارایی و انعطاف پذیری بالای این روش می باشد.

کلیدواژه ها:

لب خوانی ، بازشناسی دیداری گفتار ، استخراج ویژگی ، تبدیل فوریه گسسته ، شبکه های عصبی مصنوعی ، پردازش تصویر

نویسندگان

حجت فلاح

فارغ التحصیل کارشناسی ارشد مهندسی پزشکی، دانشکده مهندسی پزشکی، دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران، ایران

سیدکمال الدین ستاره دان

دانشیار، گروه بیوالکتریک، دانشکده مهندسی برق، دانشگاه تهران، تهران، ایران

علی مطیع نصرآبادی

دانشیار، گروه بیوالکتریک، دانشکده مهندسی پزشکی، دانشگاه شاهد، تهران، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Hassanat, A.B., Visual Words for Automatic Lip-Reading. arXiv preprint arXiv: ...
Liew, A.W.-C., Visual Speech Recognition: Lip Segmentation and Mapping: Lip ...
Shalbaf, R., et al. Recognition of Six Digits from Lip ...
th Kuala Lumpur International Conference on Biomedical Engineering 2008. 2008. ...
Zhang, Z., W. Qu, and F. Liu. Review of the ...
Lay, Y.-L, et al., Lip Language Recognition for Specific Words. ...
Bear, H.L., et al. Resolution limits on visual speech recognition. ...
Mroueh, Y., E. Marcheret, and V. Goel, Deep Multimodal Learning ...
Morade, S.S. and S. Patnaik. Lip reading using DWT and ...
Eveno, N., A. Caplier, and P.-Y. Coulon, Accurate and quas ...
Liu, X., et al. A lip cotour extraction method using ...
Morade, S.S. and S. Patnaik, A novel lip reading algorithm ...
Ibrahim, M. and D. Mulvaney, Geometric al-based lip-reading using template ...
Alan Wee-Chung, S.H.L., Wing Hong Lau, Lip contour extraction from ...
Gonzalez, R.C., R.E. Woods, and S.L. Eddins, Digital Image Processing ...
Zhang, Z., W. Qu, and F. Liu. Review of the ...
Mahoor, M.H., et al. A framework for automated measuremet of ...

نمایش کامل مراجع