برداس: سامانه برچسب گذاری نیمه خودکار داده های ساختاریافته
- سال انتشار: 1404
- محل انتشار: کنفرانس بین المللی هوش مصنوعی و فناوری های مرتبط
- کد COI اختصاصی: ICIRT01_082
- زبان مقاله: فارسی
- تعداد مشاهده: 22
نویسندگان
دانشجوی کارشناسی ارشد رشته هوش مصنوعی و رباتیکز، دانشکده هوش مصنوعی و علوم شناختی، دانشگاه جامع امام حسین(ع)، تهران، ایران
استادیار دانشکده هوش مصنوعی و علوم شناختی، دانشگاه جامع امام حسین(ع)، تهران، ایران
چکیده
کمبود داده های برچسب خورده ساختاریافته یکی از چالش های اساسی در کاربردهای یادگیری ماشین در حوزه های صنعتی، پزشکی و اقتصادی است. برچسب گذاری دستی این داده ها فرایندی زمان بر و پرهزینه بوده و روش های موجود اغلب فاقد دقت کافی برای کاربردهای حساس هستند. این پژوهش با هدف ارائه راهکاری کارآمد برای این چالش، سامانه "برداس" را به عنوان یک معماری نیمه خودکار برچسب گذاری داده های ساختاریافته طراحی و پیاده سازی نموده است. سامانه برداس با ترکیب قابلیت های مدل های زبانی، بزرگ فن های خوشه بندی و بصری، سازی و تعامل هدفمند، انسانی فرایند برچسب گذاری را در سه لایه "درک انسانی"، "برچسب گذاری" و "بازبینی انسانی" سازماندهی می کند. این معماری با شناسایی نمونه های کلیدی از طریق تحلیل های آماری و بصری سازی، فرایند برچسب گذاری را آغاز می کند، سپس با بهره گیری از مهندسی پرسش و یادگیری چند نمونه ای دانش انسانی را به مدل های زبانی منتقل کرده و برچسب گذاری خودکار در مقیاس وسیع را ممکن می سازد. در نهایت حلقه بازبینی انسانی، صحت و کیفیت نهایی برچسب ها را ارتقا می دهد. نتایج ارزیابی نشان می دهد که سامانه برداس در برچسب گذاری مجموعه داده گل زنبق با حداقل دخالت انسانی (تنها ۹ تا ۱۶ نمونه) به دقت ۹۶ درصد دست یافته و با بازبینی مختصر، انسانی این دقت به ۱۰۰ درصد افزایش می یابد. این امر منجر به کاهش چشمگیر زمان و هزینه در مقایسه با روش های سنتی شده است. نوآوری اصلی برداس طراحی یک حلقه تعاملی سه گانه الگویابی برچسب گذاری اعتبارسنجی است که برخلاف روش های رایج تنها به یک دور تعامل با کاربر نیاز دارد. این رویکرد نه تنها پیچیدگی فرایند را کاهش می دهد بلکه با حفظ انسان خبره در حلقه تصمیم گیری، کیفیت و قابلیت اعتماد برچسب ها را افزایش می دهد.کلیدواژه ها
برچسب گذاری داده های ساختاریافته, برچسب گذاری نیمه خودکار, انسان در حلقه همکاری انسان – هوش مصنوعی, یادگیری چند نمونه ایمقالات مرتبط جدید
- کاربرد شبکه های عصبی گراف در شبکه های هوشمند برق: یک مرور جامع بر تشخیص و پیش بینی خطا
- Enhanced Residual Attention CNN with Squeeze-and-Excitation Blocks for Brain Tumor MRI Classification
- ارزیابی روشهای تعبیهی گره برای تشخیص جوامع ساختاری در شبکه های فاقد ویژگی
- بهبود رمزگشای استاندارد JPEG AI در نرخ بیت پایین با استفاده از فیلتر عصبی E-Net
- طبقه بندی بهینه اهداف سونار از طریق همجوشی تصمیم گیری پیشرفته مبتنی بر اتوماتای یادگیر فازی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.