برداس: سامانه برچسب گذاری نیمه خودکار داده های ساختاریافته

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 20

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICIRT01_082

تاریخ نمایه سازی: 9 آذر 1404

چکیده مقاله:

کمبود داده های برچسب خورده ساختاریافته یکی از چالش های اساسی در کاربردهای یادگیری ماشین در حوزه های صنعتی، پزشکی و اقتصادی است. برچسب گذاری دستی این داده ها فرایندی زمان بر و پرهزینه بوده و روش های موجود اغلب فاقد دقت کافی برای کاربردهای حساس هستند. این پژوهش با هدف ارائه راهکاری کارآمد برای این چالش، سامانه "برداس" را به عنوان یک معماری نیمه خودکار برچسب گذاری داده های ساختاریافته طراحی و پیاده سازی نموده است. سامانه برداس با ترکیب قابلیت های مدل های زبانی، بزرگ فن های خوشه بندی و بصری، سازی و تعامل هدفمند، انسانی فرایند برچسب گذاری را در سه لایه "درک انسانی"، "برچسب گذاری" و "بازبینی انسانی" سازماندهی می کند. این معماری با شناسایی نمونه های کلیدی از طریق تحلیل های آماری و بصری سازی، فرایند برچسب گذاری را آغاز می کند، سپس با بهره گیری از مهندسی پرسش و یادگیری چند نمونه ای دانش انسانی را به مدل های زبانی منتقل کرده و برچسب گذاری خودکار در مقیاس وسیع را ممکن می سازد. در نهایت حلقه بازبینی انسانی، صحت و کیفیت نهایی برچسب ها را ارتقا می دهد. نتایج ارزیابی نشان می دهد که سامانه برداس در برچسب گذاری مجموعه داده گل زنبق با حداقل دخالت انسانی (تنها ۹ تا ۱۶ نمونه) به دقت ۹۶ درصد دست یافته و با بازبینی مختصر، انسانی این دقت به ۱۰۰ درصد افزایش می یابد. این امر منجر به کاهش چشمگیر زمان و هزینه در مقایسه با روش های سنتی شده است. نوآوری اصلی برداس طراحی یک حلقه تعاملی سه گانه الگویابی برچسب گذاری اعتبارسنجی است که برخلاف روش های رایج تنها به یک دور تعامل با کاربر نیاز دارد. این رویکرد نه تنها پیچیدگی فرایند را کاهش می دهد بلکه با حفظ انسان خبره در حلقه تصمیم گیری، کیفیت و قابلیت اعتماد برچسب ها را افزایش می دهد.

کلیدواژه ها:

برچسب گذاری داده های ساختاریافته ، برچسب گذاری نیمه خودکار ، انسان در حلقه همکاری انسان – هوش مصنوعی ، یادگیری چند نمونه ای

نویسندگان

علی ژاله کریمی

دانشجوی کارشناسی ارشد رشته هوش مصنوعی و رباتیکز، دانشکده هوش مصنوعی و علوم شناختی، دانشگاه جامع امام حسین(ع)، تهران، ایران

محمد علی جوادزاده

استادیار دانشکده هوش مصنوعی و علوم شناختی، دانشگاه جامع امام حسین(ع)، تهران، ایران