طبقه بندی ارقام دست نوشته فارسی با استفاده از تجزیه مقدار تکین مرتبه بالا

  • سال انتشار: 1395
  • محل انتشار: اولین کنفرانس ملی مهندسی کامپیوتر، علوم کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: NCRC01_064
  • زبان مقاله: فارسی
  • تعداد مشاهده: 771
دانلود فایل این مقاله

نویسندگان

الهه خدابخشی

دانشگاه قم

عفت گلپر رابوکی

استادیار، دانشگاه قم

چکیده

حدود یک قرن است که از تجزیه های ماتریسی در تحلیل مجموعه عظیم داده ها استفاده می شود. داده ها اغلب یک ساختار چند بعدی دارند که تا حدودی سازماندهی آنها به بردارها و ماتریس ها غیرطبیعی است، زیرا در بسیاری از موارد استفاده از مجموعه داده ها بدون از بین بردن ساختار چند بعدی آنها مفید است. این ساختارهای چند بعدی را بوسیله تانسورها که تعمیمی از مارتیس های دو بعدی به ابعاد بالتر می باشند، می توان نشان داد. برای مثال یک ویدئو یک دنباله زمانی از تصاویر رنگی، دنباله ای از تانسورهای سه بعدی است که به همراه بعد زمان یک تانسور چهار بعدی را تشکیل می دهد. با تعمیم تجزیه های ماتریسی به تجزیه های تانسوری، این تجزیه ها در سال های اخیر به یکی از ابزارهای مهم برای کشف دانش پنهان در مجموعه داده ها تبدیل شده اند. تجزیه ها با ارائه یک پایه برای نمایش فضای داده ها علاوه بر صرفه جویی در مصرف حافظه به کشف معانی پنهان در داده ها کمک می کنند. یکی از روش های تجزیه تانسوری، تجزیه مقدار تکین مرتبه بالا (HOSVD) است که تعمیمی از تجزیه SVD ماتریس های می باشد. در این مقاله این تجزیه را معرفی و برخی ویژگی های آنرا بررسی می کنیم و سپس از آن در شناسایی ارقام دست نوشته فارسی استفاده می کنیم.

کلیدواژه ها

تجزیه ماتریسی - تجزیه تانسوری - آرایه های چند راهی - تجزیه مقدار تکین مرتبه بالا - کاهش بعد

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.