CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

روش جدید برای شناسایی خودکار زبان درمتون دو زبانه فارسی و انگلیسی با قلم های متفاوت تا سطح کلمه

عنوان مقاله: روش جدید برای شناسایی خودکار زبان درمتون دو زبانه فارسی و انگلیسی با قلم های متفاوت تا سطح کلمه
شناسه ملی مقاله: COMCONF05_534
منتشر شده در پنجمین کنفرانس بین المللی مهندسی برق و کامپیوتر با تاکید بر دانش بومی در سال 1396
مشخصات نویسندگان مقاله:

عین اله حاتمی - دانشجوی دکتری هوش مصنوعی و رباتیکز،گروه کامپیوتر،دانشکده فنی و مهندسی، واحد تهران شمال،تهران
مهدی صادق زاده - استادیار،گروه کامپیوتر، واحد ماهشهر،دانشگاه آزاد اسلامی، ماهشهر

خلاصه مقاله:
در متون چابی که شامل چندین زبان نوشتاری میباشد.شناسایی زبان نوشتاری اولین گام در سیستم شناسایی نوری حرو میباشد. در این مقاله یک روش جدید و موثر برای شناسایی زبان نوشتاری خطوط و کلمات در متون چابی دو زبانه فارسی و انگلیسی روبش شده ارایه شده است.ابتدا خطوط متنی و کلمات از تصویر جداسازی میشوند و سپس برای جداسازی این دو زبان و استخراج ویژگیها از دو روش مبتنی بر طرح پروفایل افقی استفاده شده است . در روش اول نسبت میانگین به واریانس تعداد نقاط روشن از هر کلمه نسبت به محیط محاط شده را محاسبه میکنیم و در تکنیک دوم هر خط به سه ناحیه بالایی،میانی و پایینی تقسیم می شود که آنگاه نقطه ماکسیمم مطلق و بزرگترین نقطه ماکسیمم نسبی بعدی ناحیه میانی را بر اساس پروفایل افقی بدست میآوریم. خطوط نوشتاری و کلمات با قلم ها و اندازه های متفاوت برای تست سیستم پیشنهادی استفاده شدهاند. این الگوریتم بر روی 75 صفحه روبش شده متفاوت که شامل 1250 خط متنی و 20400 کلمه از دو زبان نوشتاری میباشد بادقت99,85تست شده است.

کلمات کلیدی:
شناسایی زبان نوشتار ،متون چند زبانه چابی ،شناسایی نوری حروف،شناسایی زبان فارسی و انگلیسی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/725508/