روش جدید برای شناسایی خودکار زبان درمتون دو زبانه فارسی و انگلیسی با قلم های متفاوت تا سطح کلمه
عنوان مقاله: روش جدید برای شناسایی خودکار زبان درمتون دو زبانه فارسی و انگلیسی با قلم های متفاوت تا سطح کلمه
شناسه ملی مقاله: COMCONF05_534
منتشر شده در پنجمین کنفرانس بین المللی مهندسی برق و کامپیوتر با تاکید بر دانش بومی در سال 1396
شناسه ملی مقاله: COMCONF05_534
منتشر شده در پنجمین کنفرانس بین المللی مهندسی برق و کامپیوتر با تاکید بر دانش بومی در سال 1396
مشخصات نویسندگان مقاله:
عین اله حاتمی - دانشجوی دکتری هوش مصنوعی و رباتیکز،گروه کامپیوتر،دانشکده فنی و مهندسی، واحد تهران شمال،تهران
مهدی صادق زاده - استادیار،گروه کامپیوتر، واحد ماهشهر،دانشگاه آزاد اسلامی، ماهشهر
خلاصه مقاله:
عین اله حاتمی - دانشجوی دکتری هوش مصنوعی و رباتیکز،گروه کامپیوتر،دانشکده فنی و مهندسی، واحد تهران شمال،تهران
مهدی صادق زاده - استادیار،گروه کامپیوتر، واحد ماهشهر،دانشگاه آزاد اسلامی، ماهشهر
در متون چابی که شامل چندین زبان نوشتاری میباشد.شناسایی زبان نوشتاری اولین گام در سیستم شناسایی نوری حرو میباشد. در این مقاله یک روش جدید و موثر برای شناسایی زبان نوشتاری خطوط و کلمات در متون چابی دو زبانه فارسی و انگلیسی روبش شده ارایه شده است.ابتدا خطوط متنی و کلمات از تصویر جداسازی میشوند و سپس برای جداسازی این دو زبان و استخراج ویژگیها از دو روش مبتنی بر طرح پروفایل افقی استفاده شده است . در روش اول نسبت میانگین به واریانس تعداد نقاط روشن از هر کلمه نسبت به محیط محاط شده را محاسبه میکنیم و در تکنیک دوم هر خط به سه ناحیه بالایی،میانی و پایینی تقسیم می شود که آنگاه نقطه ماکسیمم مطلق و بزرگترین نقطه ماکسیمم نسبی بعدی ناحیه میانی را بر اساس پروفایل افقی بدست میآوریم. خطوط نوشتاری و کلمات با قلم ها و اندازه های متفاوت برای تست سیستم پیشنهادی استفاده شدهاند. این الگوریتم بر روی 75 صفحه روبش شده متفاوت که شامل 1250 خط متنی و 20400 کلمه از دو زبان نوشتاری میباشد بادقت99,85تست شده است.
کلمات کلیدی: شناسایی زبان نوشتار ،متون چند زبانه چابی ،شناسایی نوری حروف،شناسایی زبان فارسی و انگلیسی
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/725508/