روش جدید برای شناسایی خودکار زبان درمتون دو زبانه فارسی و انگلیسی با قلم های متفاوت تا سطح کلمه

عین اله حاتمی; مهدی صادق زاده

روش جدید برای شناسایی خودکار زبان درمتون دو زبانه فارسی و انگلیسی با قلم های متفاوت تا سطح کلمه

محل انتشار: پنجمین کنفرانس بین المللی مهندسی برق و کامپیوتر با تاکید بر دانش بومی

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 789

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/725508

شناسه ملی سند علمی:

COMCONF05_534

تاریخ نمایه سازی: 21 اردیبهشت 1397

چکیده مقاله:

در متون چابی که شامل چندین زبان نوشتاری میباشد.شناسایی زبان نوشتاری اولین گام در سیستم شناسایی نوری حرو میباشد. در این مقاله یک روش جدید و موثر برای شناسایی زبان نوشتاری خطوط و کلمات در متون چابی دو زبانه فارسی و انگلیسی روبش شده ارایه شده است.ابتدا خطوط متنی و کلمات از تصویر جداسازی میشوند و سپس برای جداسازی این دو زبان و استخراج ویژگیها از دو روش مبتنی بر طرح پروفایل افقی استفاده شده است . در روش اول نسبت میانگین به واریانس تعداد نقاط روشن از هر کلمه نسبت به محیط محاط شده را محاسبه میکنیم و در تکنیک دوم هر خط به سه ناحیه بالایی،میانی و پایینی تقسیم می شود که آنگاه نقطه ماکسیمم مطلق و بزرگترین نقطه ماکسیمم نسبی بعدی ناحیه میانی را بر اساس پروفایل افقی بدست میآوریم. خطوط نوشتاری و کلمات با قلم ها و اندازه های متفاوت برای تست سیستم پیشنهادی استفاده شدهاند. این الگوریتم بر روی 75 صفحه روبش شده متفاوت که شامل 1250 خط متنی و 20400 کلمه از دو زبان نوشتاری میباشد بادقت99,85تست شده است.

کلیدواژه ها:

شناسایی زبان نوشتار ، متون چند زبانه چابی ، شناسایی نوری حروف ، شناسایی زبان فارسی و انگلیسی

نویسندگان

عین اله حاتمی

دانشجوی دکتری هوش مصنوعی و رباتیکز،گروه کامپیوتر،دانشکده فنی و مهندسی، واحد تهران شمال،تهران

مهدی صادق زاده

استادیار،گروه کامپیوتر، واحد ماهشهر،دانشگاه آزاد اسلامی، ماهشهر