طبقه بندی ارقام دست نوشته فارسی با استفاده از تجزیه مقدار تکین مرتبه بالا
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 712
فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCRC01_064
تاریخ نمایه سازی: 25 آذر 1395
چکیده مقاله:
حدود یک قرن است که از تجزیه های ماتریسی در تحلیل مجموعه عظیم داده ها استفاده می شود. داده ها اغلب یک ساختار چند بعدی دارند که تا حدودی سازماندهی آنها به بردارها و ماتریس ها غیرطبیعی است، زیرا در بسیاری از موارد استفاده از مجموعه داده ها بدون از بین بردن ساختار چند بعدی آنها مفید است. این ساختارهای چند بعدی را بوسیله تانسورها که تعمیمی از مارتیس های دو بعدی به ابعاد بالتر می باشند، می توان نشان داد. برای مثال یک ویدئو یک دنباله زمانی از تصاویر رنگی، دنباله ای از تانسورهای سه بعدی است که به همراه بعد زمان یک تانسور چهار بعدی را تشکیل می دهد. با تعمیم تجزیه های ماتریسی به تجزیه های تانسوری، این تجزیه ها در سال های اخیر به یکی از ابزارهای مهم برای کشف دانش پنهان در مجموعه داده ها تبدیل شده اند. تجزیه ها با ارائه یک پایه برای نمایش فضای داده ها علاوه بر صرفه جویی در مصرف حافظه به کشف معانی پنهان در داده ها کمک می کنند. یکی از روش های تجزیه تانسوری، تجزیه مقدار تکین مرتبه بالا (HOSVD) است که تعمیمی از تجزیه SVD ماتریس های می باشد. در این مقاله این تجزیه را معرفی و برخی ویژگی های آنرا بررسی می کنیم و سپس از آن در شناسایی ارقام دست نوشته فارسی استفاده می کنیم.
کلیدواژه ها:
تجزیه ماتریسی - تجزیه تانسوری - آرایه های چند راهی - تجزیه مقدار تکین مرتبه بالا - کاهش بعد
نویسندگان
الهه خدابخشی
دانشگاه قم
عفت گلپر رابوکی
استادیار، دانشگاه قم
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :