روش جدید برای شناسایی خودکار زبان درمتون دو زبانه فارسی و انگلیسی با قلم های متفاوت تا سطح کلمه
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 789
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMCONF05_534
تاریخ نمایه سازی: 21 اردیبهشت 1397
چکیده مقاله:
در متون چابی که شامل چندین زبان نوشتاری میباشد.شناسایی زبان نوشتاری اولین گام در سیستم شناسایی نوری حرو میباشد. در این مقاله یک روش جدید و موثر برای شناسایی زبان نوشتاری خطوط و کلمات در متون چابی دو زبانه فارسی و انگلیسی روبش شده ارایه شده است.ابتدا خطوط متنی و کلمات از تصویر جداسازی میشوند و سپس برای جداسازی این دو زبان و استخراج ویژگیها از دو روش مبتنی بر طرح پروفایل افقی استفاده شده است . در روش اول نسبت میانگین به واریانس تعداد نقاط روشن از هر کلمه نسبت به محیط محاط شده را محاسبه میکنیم و در تکنیک دوم هر خط به سه ناحیه بالایی،میانی و پایینی تقسیم می شود که آنگاه نقطه ماکسیمم مطلق و بزرگترین نقطه ماکسیمم نسبی بعدی ناحیه میانی را بر اساس پروفایل افقی بدست میآوریم. خطوط نوشتاری و کلمات با قلم ها و اندازه های متفاوت برای تست سیستم پیشنهادی استفاده شدهاند. این الگوریتم بر روی 75 صفحه روبش شده متفاوت که شامل 1250 خط متنی و 20400 کلمه از دو زبان نوشتاری میباشد بادقت99,85تست شده است.
کلیدواژه ها:
نویسندگان
عین اله حاتمی
دانشجوی دکتری هوش مصنوعی و رباتیکز،گروه کامپیوتر،دانشکده فنی و مهندسی، واحد تهران شمال،تهران
مهدی صادق زاده
استادیار،گروه کامپیوتر، واحد ماهشهر،دانشگاه آزاد اسلامی، ماهشهر