ایجاد مدل هوش مصنوعی بر پایه مبدل به منظور پاسخ به سوالات از داده های بدون ساختار

  • سال انتشار: 1403
  • محل انتشار: مجله علوم رایانشی، دوره: 9، شماره: 1
  • کد COI اختصاصی: JR_CSJI-9-1_006
  • زبان مقاله: فارسی
  • تعداد مشاهده: 197
دانلود فایل این مقاله

نویسندگان

فریبرز دلیری

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشکده و پژوهشکده رایانه شبکه و ارتباطات، دانشگاه جامع امام حسین(ع)، تهران، ایران

محسن نوروزی

پژوهشگر گروه مهندسی کامپیوتر، دانشکده و پژوهشکده رایانه شبکه و ارتباطات، دانشگاه جامع امام حسین(ع)، تهران، ایران

علی ناصری

استاد گروه مهندسی کامپیوتر، دانشکده و پژوهشکده رایانه شبکه و ارتباطات، دانشگاه جامع امام حسین(ع)، تهران، ایران

چکیده

به دنبال موفقیت های چشم گیر مدل های زبانی از پیش آموزش دیده و یادگیری انتقالی، اخیرا موج قابل توجهی از تحقیقات هوش مصنوعی در این حوزه انجام شده است. مدل های زبانی یکی از مولفه های اساسی در پردازش زبان طبیعی هستند. این مدل ها تنها یک بار روی پیکره های بزرگ متنی به صورت خود ناظر آموزش دیده و سپس در حل مسایل  مختلف فهم زبانی مانند پاسخ به پرسش، بسط متن و طبقه بندی متون به کارگیری می شوند. به کارگیری مبدل ها برای حل مسایل  گوناگون مستلزم فراهم نمودن سه پیش نیاز (مدل، مجموعه داده مناسب، استانداردهایی به منظور توصیف نحوه ارزیابی مدل) است. بررسی حجم بالای اسناد بدون ساختار که بیشتر در قالب متن هستند برای متخصصان امری دشوار است. از طرفی پاسخ به بسیاری از سوالات تحقیق نیازمند بررسی حجم بالایی از متون است. در این پژوهش به منظور پاسخ به سوالات از روی متون بدون ساختار در زمینه تحلیل امنیت شبکه های کامپیوتری سیستمی بر پایه هوش مصنوعی ارایه شده است. سیستم مذکور بر پایه مبدل ها پیاده سازی شده و با زبان پایتون و در بن سازه گوگل کولب پرو کدنویسی و پیاده سازی شده است. این سیستم پس از آموزش روی پرسش و پاسخ های حوزه امنیت شبکه های کامپیوتری قادر به استخراج پاسخ سوالات از متن بدون ساختار است. به منظور آموزش مدل یک مجموعه داده سفارشی به نام هوشفا توسعه داده شده است که شامل ۱۲.۱۵۷ رکورد است. سیستم مذکور پس از ارزیابی دقت ارایه پاسخ در معیار تطبیق دقیق را بسته به نوع مدل پایه به میزان ۲۰ تا ۴۳ درصد و در معیار اف ۱ به میزان ۸ تا ۱۸ درصد بهبود بخشیده است. همچنین برای تعیین داده های مرتبط آموزشی برای آموزش مدل ها، سیستم پیشنهادی از یک مدل طبقه بندی داده استفاده می کند. نمرات ارزیابی مدل طبقه بندی داده نتایج بالای۸۰% در معیارهای اف۱، پوشش و صحت را نشان داده است. همچنین نمرات ارزیابی تعیین داده های غیر مرتبط نتایج بالای ۹۷% در معیارهای اف۱، پوشش و صحت را نشان داده است.

کلیدواژه ها

مبدل ها, تحلیل داده های بدون ساختار, پردازش زبان طبیعی, امنیت شبکه های کامپیوتری, مدل های زبانی از پیش آموزش دیده

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.