بیست و هشتمین کنفرانس بین المللی انجمن کامپیوتر ایران تهیە دادگان و مدل پایه برای گفتگوگر با قابلیت استخراج اطلاعات

  • سال انتشار: 1401
  • محل انتشار: بیست و هشتمین کنفرانس بین المللی کامپیوتر انجمن کامپیوتر ایران
  • کد COI اختصاصی: CSICC28_024
  • زبان مقاله: فارسی
  • تعداد مشاهده: 310
دانلود فایل این مقاله

نویسندگان

پگاه صفری

دانشجوی دکتری هوش مصنوعی و رباتیکز ، دانشکده برق و کامپیوتر ، دانشگاه شهید بهشتی، تهران

مهرنوش شمس فرد

دانشیار، گروه هوش مصنوعی ، رباتیک و رایانش شناختی، دانشگاه شهید بهشتی ، تهران

چکیده

گفتگو گر در چت بات یکی از اجزای اصلی در هوشمند سازی تعامل انسان و رایانه به شمار آمده و در سال های اخیر پژوهش های زیادی در این زمینه شکل گرفته است.در این مقاله،گفتگوگری فارسی پیشنهاد شده است که می تواند با کاربر حول مسائل روزمره گفتگو کره و اطلاعات شخصی همچون نام فرد،سن،شغل،تعداد فرزندان و ... را استخراج نماید.بنابراین ،سیستم باید حداقل سوال مستقیم را مطرح کرده و در عوض،خود را ترغیب به بیان اطلاعات نماید.اطلاعات استخراج شده از این گفتگو می تواند در گام بعد در سیستم هایی همچون توصیه گرها مورد استفاده قرار گیرد.برای این منظور،مجموعه داده ای به روش خزش،ترجمه بخشی از پیکره پرسوناچت و همچنین راه اندازی سامانه ای بر خط جمع آوری شد و بعد از برچسب زنی،با مدلی مبتنی بر برت،پایه ای برای توسعه واحد درک معنا قرار گرفت.با افزونه سازی نیمه خودکار این داده ها برای سه شکاف پر تکرار نام،شغل و سرگرمی ،عملکرد مدل برای شکاف بر اساس F۱ به ۸۱٪ و بر حسب دقت هم برای تعیین موضوع کلی گفته به ۱/۹۰٪ رسید.در واحد تولید پاسخ هم با آموزش مدل دنباله به دنباله بر روی تمام داده ها،سرگشتگی بر روی مجموعه آزمون به ۸۱/۱ و ROUGE – ۱ به ۷/۰ رسید

کلیدواژه ها

گفتگو گر،استخراج اطلاعات شخصی،جمع آوری داده،افزونه سازی ،واحد درک معنا،واحد تولید پاسخ

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.