طبقه بندی ارقام دست نوشته فارسی با استفاده از تجزیه مقدار تکین مرتبه بالا
- سال انتشار: 1395
- محل انتشار: اولین کنفرانس ملی مهندسی کامپیوتر، علوم کامپیوتر و فناوری اطلاعات
- کد COI اختصاصی: NCRC01_064
- زبان مقاله: فارسی
- تعداد مشاهده: 783
نویسندگان
دانشگاه قم
استادیار، دانشگاه قم
چکیده
حدود یک قرن است که از تجزیه های ماتریسی در تحلیل مجموعه عظیم داده ها استفاده می شود. داده ها اغلب یک ساختار چند بعدی دارند که تا حدودی سازماندهی آنها به بردارها و ماتریس ها غیرطبیعی است، زیرا در بسیاری از موارد استفاده از مجموعه داده ها بدون از بین بردن ساختار چند بعدی آنها مفید است. این ساختارهای چند بعدی را بوسیله تانسورها که تعمیمی از مارتیس های دو بعدی به ابعاد بالتر می باشند، می توان نشان داد. برای مثال یک ویدئو یک دنباله زمانی از تصاویر رنگی، دنباله ای از تانسورهای سه بعدی است که به همراه بعد زمان یک تانسور چهار بعدی را تشکیل می دهد. با تعمیم تجزیه های ماتریسی به تجزیه های تانسوری، این تجزیه ها در سال های اخیر به یکی از ابزارهای مهم برای کشف دانش پنهان در مجموعه داده ها تبدیل شده اند. تجزیه ها با ارائه یک پایه برای نمایش فضای داده ها علاوه بر صرفه جویی در مصرف حافظه به کشف معانی پنهان در داده ها کمک می کنند. یکی از روش های تجزیه تانسوری، تجزیه مقدار تکین مرتبه بالا (HOSVD) است که تعمیمی از تجزیه SVD ماتریس های می باشد. در این مقاله این تجزیه را معرفی و برخی ویژگی های آنرا بررسی می کنیم و سپس از آن در شناسایی ارقام دست نوشته فارسی استفاده می کنیم.کلیدواژه ها
تجزیه ماتریسی - تجزیه تانسوری - آرایه های چند راهی - تجزیه مقدار تکین مرتبه بالا - کاهش بعدمقالات مرتبط جدید
- سودآوری مشتریان در خردهفروشی قطعات یدکی ماشین آلات راهسازی با رویکرد یادگیری ماشین
- ارائه روشی کارآمد جهت شناسایی کودکان نیازمند به پیوند مغز استخوان با استفاده از ترکیب طبقه بند ماشین بردار پشتیبان و الگوریتم بهینه سازی فاخته
- استخراج بهینه پارامترهای تاثیر گذار الگوریتم بهینه سازی بوفالوی آفریقایی با هدف استخراج ویژگی های مهم به منظور افزایش کارایی طبقه بندی داده ها
- ارائه روشی کارآمد برای بهبود عملکرد الگوریتم بهینه سازی کلاغ سیاه به منظور افزایش صحت خوشه بندی داده ها
- استفاده از الگوریتم باور بیزین در لایه کاملا متصل شبکه عصبی کانولوشن با هدف افزایش دقت تشخیص تصاویر
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.