خواندن اعداد از گزارش های سالانه

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 201

فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICAMAO08_014

تاریخ نمایه سازی: 24 شهریور 1402

چکیده مقاله:

بسیاری از سازمان ها برای بررسی عملکرد خود در فواصل زمانی متفاوت علاقه مند به تجزیه وتحلیل گزارش های سالانه هستند که در این زمینه استراتژی های متفاوتی به کار برده میشود. به دلیل اهمیت بالای این امر در توسعه یک سازمان و یک شرکت، این مقاله روش هایی را برای استخراج ارقام کلیدی از گزارش های سالانه اسکن شده ارائه میدهد. در این راستا یک رویکرد دو مرحله ا ی پیشنهاد میشود که در آن هر بخش در طبقه مختلفی قرار می گیرد و یک الگوریتم جداگانه را ارائه می دهد و سپس اقدام به شناسایی و استخراج ارقام کلیدی در این زمینه میکند . تشخیص کاراکتر نوری(OCR)۱ با استفاده از تسرکت ۲ انجام میشود. این داده ها شامل گزارشات سالانه معتبراست که توسط شرکت های سوئدی ارسال میشود که برای هریک از آنها برچسب های صفحه ای و همچنین چهار رقم کلیدی مختلف استفاده شده است. برای کار طبقه بندی صفحه، یک طبقه بندی کننده جنگل تصادفی بر روی صفحات تعبیه شده TF-IDF برای دستیابی به دقت آزمون استفاده میشود. در این راستا فن های مختلف پردازش تصویر موردبررسی قرار میگیرند. فیلتر RCC۳ دقت داده های استخراج شده را بهبود میبخشد. با استفاده از فن پردازش تصویر مبتنی بر تسرکت میتوان پیشرفت های بیشتری را انجام داد.

نویسندگان

اکرم تفتیان

استادیار، گروه حسابداری، واحد یزد، دانشگاه آزاد اسلامی، ایران

عارفه جلالی فرد

دانشجوی کارشناسی ارشد، گروه حسابداری، واحد یزد، دانشگاه آزاد اسلامی، ایران