استخراج اطلاعات معنایی از تصاویر متنی مبتنی بر طبقه بندی

  • سال انتشار: 1388
  • محل انتشار: دومین کنفرانس ملی مهندسی برق
  • کد COI اختصاصی: NEEC02_066
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1661
دانلود فایل این مقاله

نویسندگان

حسین پورقاسم

گروه مخابرات دانکده برق- دانشگاه آزاد اسلامی واحد نجف آباد

چکیده

شناسایی و استخراج اطلاعات از تصاویر متنی در اینترنت یکی از مهمترین مسائل مهم در سیستم های جمع آوری اطلاعاتی در حوزه ی تکنولوژی اطلاعات می باشد. در این مقاله، جهت تجزیه و تحلیل تصاویر متنی و دسترسی به محتوای آنها، از یک روش طبقه بندی مبتنی بر ناحیه بندی تصویر استفاده شده است. در این الگوریتم به کمک یک روش ناحیه بندی دو مرحله ای، نواحی تصویر شناسایی شده، سپس به کمک یک ساختار سلسله مراتبی طبقه بندی، نوع ناحیه از لحاظ متنی یا عکسی ( غیر متنی ) بودن مشخص می گردد. در ادامه با تعریف با ارزش بودن متن یک تصویر متنی، سعی می شود تصویر متنی در یکی از دو گروه معنایی با ارزش و بی ارزش دسته بندی گردد. الگوریتم پیشنهادی بر روی یک پایگاه داده تصاویر متنی و غیرمتنی که از تصاویر موجود در اینترنت فراهم شده است، مورد ارزیابی قرار می گیرد. نتایج آزمایشها بیانگر کارایی روش پیشنهادی در طبقه بندی معنایی تصاویر بر اساس تعریف کاربر از با ارزش و بی ارزش بودن تصاویر متنی است. الگوریتم پیشنهادی، صحت طبقه بندی 98/8% برای طبقه بندی تصاویر متنی با ارزش از بی ارزش را فراهم کرده است.

کلیدواژه ها

استخراج اطلاعات، طبقه بندی، تصاویر متنی و غیر متنی ، ارزشمندی اطلاعات

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.