جداسازی متن فارسی از تصویر اسکن شده نقشه های شهری

  • سال انتشار: 1390
  • محل انتشار: هفتمین کنفرانس ماشین بینایی و پردازش تصویر ایران
  • کد COI اختصاصی: ICMVIP07_024
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1698
دانلود فایل این مقاله

نویسندگان

علی غفاری برانقار

گروه کامپیوتر، دانشگاه آزاد اسلامی واحد قزوین

احسان اله کبیر

گروه برق و الکترونیک، دانشگاه تربیت مدرس، تهران

کاوه کنگرلو

گروه برق و الکترونیک، دانشگاه آزاد اسلامی واحد تهران مرکز

چکیده

متن موجود در تصاویر، یکی از مهترین ویژگی های قابل استخراج و مفید تصاویر است. برچسب های متنی موجود در نقشه های شهری حاوی اطلاعات مفیدی راجع به محتوای نقشه است. در این مقاله، روشی جدید برای استخراج متن فارسی موجود در تصویر اسکن شده نقشه های شهری ارائه داده ایم. با توجه به روی هم افتادگی و یا تلاقی متن و خطوط گرافیکی نقشه، جداسازی متن از نقشه های شهری یکی از چالشهای مهم در زمینه استخراج متن از تصویر است. برای حل این مساله، ابتدا تصویر خاکستری به تصویر دودویی تبدیل می شود و سپس با دو فیلتر اندازه مساحت و فیلتر نسبت دید، مولفه های همبند به دو کلاس متن و گرافیک دسته بندی می شوند. این دسته بندی دارای خطای زیادی است. بنابراین با تناظریابی پیکسلهای تصویرمتن و گرافیک با تصویر خاکستری، دو آستانه جداساز شدت روشنایی برای تصویر خاکستری بدست می آید. با این دو آستانه می توان متن های موجود در تصویر خاکستری را با دقت بالایی آشکار نماییم. نتایج تجربی نشان می دهد روش ارائه شده در این مقاله برای نقشه های با دقت اسکن حداقل dpi300، دارای دقت تشخیص خوبی در استخراج متن از تصویر دارد.

کلیدواژه ها

جداسازی متن، متن و گرافیک، نقشه های شهری، آشکارسازی متن

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.