یک رویکرد مبتنی بر مدل برای شناسایی و اصلاح نویسه های فارسی و عرب مستقل از متن آفلاین
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 557
فایل این مقاله در 23 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
SENACONF02_177
تاریخ نمایه سازی: 30 آبان 1394
چکیده مقاله:
مدل های نسل حرکت سریع در مقالات به عنوان یک ابزار موثر برای درک رفتار دست خط توصیف شده است . زمینه های کاربرد گوناگون هستند که شامل توصیف دست خط بازسازی و اخیرا OCR، در این مقاله یک رویکرد مبتنی برنویسه (یکی از حروف الفبا) را برای شناسایی اصلاح نویسه فارسی و عربی آفلاین پیشنهاد می کنیم . بلکه بیش از استخراج نویسه های خودش را براساس مدل بتا- بیضی ترکیب می کند اصل آن متکی به استقلال از کتاب کد نویسه از همه فرایند تمرینی و استفاده ازیک مدل به جای آن است . یک کتاب کد کامل و چهار کتاب کد جزئی درست شده و تست شده اند ، با استفاده از انتخاب مشخصه ، کتاب های کد خام با توجه به FDR، و رابطه ی مقطعی و معیار نمونه گیری تصادفی ، سایز آن ها کاهشمی یابد . یک مجموع 60 بردار مشخصه با استفاده از تطبیق الگو استخراج شده اند و با 411 نویسه جداگانه از دیتابیس FN/ENIT1 ارزیابی شدند . نتایج ارائه شده دراین مطالعه نمایش وسیع قابلیت تعمیم دهی خوب از کتاب های کد ترکیبی را نشان می دهد . ما یک نرخ 90/02% در نخست و سپس نرخ 96/35 % برای شناسایی نویسنه و یک EER=2/1 برای اصلاح نویسه بدست آوردیم رویکرد ما ، خصوصیات بهتری نسبت بیشتر تکنیک های بررسی شده برحسب سایز نوشته جات و نرخ شناسایی ، نشان داد . تا آنجا که می دانیم این مطالعه اولین مطالعه برای درونیابی مفهوم کتاب های کد ترکیبی مبتنی بر مدل در شناسایی و اصلاح نویسه های فارسی و عربی است.
کلیدواژه ها:
شناسایی و اصلاح ، متن آفلاین ، لغات فارسی ، الفبای ، بیومتریک ، رویکرد شناسایی ، دیتابیس ، ماتریس ، مدل بتا ، شکل بیضی
نویسندگان
سید محمد سلیمانی
مدرس (مربی) ،گروه فناوری اطلاعات ، مرکز آموزش علمی کاربردی شهرداری بیارجمند
هادی حسینی
دانشجو ،گروه فناوری اطلاعات ، مرکز آموزش علمی کاربردی شهرداری بیارجمند
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :