تشخیص فونت حروف و کلمات چاپی فارسی
- سال انتشار: 1392
- محل انتشار: شانزدهمین کنفرانس دانشجویی مهندسی برق ایران
- کد COI اختصاصی: ISCEE16_425
- زبان مقاله: فارسی
- تعداد مشاهده: 1909
نویسندگان
دانشجوی مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی
دانشجوی مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی
مدرس گروه مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی
چکیده
در این مقاله به بیان پیاده سازی الگوریتم تشخیص فونت در بازشناسی متون چاپی فارسی، با درجه تفکیک 300 نقطه بر اینچ پرداخته می شود. لازمه ی انجام این کار تشخیص قسمت های متنی تصویر ورودی از سایر قسمت ها می باشد. این روش مبتنی بر جداسازی خطوط متن بوده و با زیرکلمات نیز قابل تعمیم است و فرایند بازشناسی در چندین مرحله، با استفاده شبکه عصبی تقویت شده انجام می گیرد. پیش پردازش هایی نظیر رفع نویز و برطرف کردن کجی تصویر، انجام می شود. قسمت های متنی تصویر ورودی پس از اصلاح چرخش و رفع نویز با استفاده از شبکه ی عصبی تشخیص متن از غیرمتتن، مشخص و نواحی متن دار تصویر اولیه بازسازی می شود. شبکه ی عصبی استفاده شده در تشخیص نوع فونت به خوبی می تواند نوع فونت سند را تشخیص دهد که این مرحله در مراحل بعدی شناسایی کاراکتر تاثیر به سزایی دارد. این روش روی 8 نوع فونت فارسی با درجه تفکیک 300 نقطه بر اینچ آزمایش شده و دقت بازشناسی بالایی برای هر کدام حاصل شده است.کلیدواژه ها
تشخیص فونت، تشخیص متن از غیرمتن، سیستم نوری بازشناسی حروف، شبکه ی عصبی، متون فارسیمقالات مرتبط جدید
- سیستم تشخیص نفوذ در محیط رایانش ابری با استفاده از یادگیری ویژ گی
- کاهش هزینه تعمیراتی ماشین های سنگین از طریق بهبود الگوریتم درخت تصمیم با الگوریتم های انتخاب ویژگی Information Gain ،Correlation و SVM
- پردازش کوانتومی تصاویر پزشکی و تشخیص لبه آن با استفاده از الگوریتم QHED
- بررسی و مقایسه روشهای تشخیص اکانت های جعلی در شبکه های اجتماعی
- مکان یابی و مقدار بهینه منابع تولید پراکنده به منظورکاهش تلفات و بهبود انحراف ولتاژ شبکه نامتعادل توزیع
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.