تکنیکها، کاربردها و پیشرفت های استخراج اطلاعات از متن

  • سال انتشار: 1403
  • محل انتشار: اولین کنفرانس بین المللی هوش مصنوعی در عصر تحول دیجیتال
  • کد COI اختصاصی: AICNF01_107
  • زبان مقاله: فارسی
  • تعداد مشاهده: 85
دانلود فایل این مقاله

نویسندگان

محمدرضا بحرانی

دانشجو کارشناسی ارشد، گروه مهندسی کامپیوتر، موسسه آموزش عالی آپادانا، شیراز

هاله همایونی

استادیار، عضو هیئت علمی گروه مهندسی کامپیوتر، موسسه آموزش عالی آپادانا، شیراز

زهرا تصمیم قطعی

کارشناس ارشد گروه مهندسی کامپیوتر، موسسه آموزش عالی آپادانا، شیراز

چکیده

استخراج اطلاعات یکی از حوزه های کلیدی پردازش زبان طبیعی است که هدف آن استخراج داده های ساختاریافته از متون غیرساختاریافته است. این مقاله مروری به بررسی پیشرفت های اخیر در تکنیک های مختلف استخراج اطلاعات، از جمله شناسایی موجودیت های نامدار (NER)، استخراج روابط، شناسایی رویدادها و تحلیل احساسات می پردازد. همچنین، چالش های مرتبط با داده های حجیم و متنوع، استفاده از مدل های یادگیری عمیق و تکنیک های نوظهور مانند مدل های زبانی بزرگ (LLMs) بررسی شده است. در نهایت، کاربردهای گسترده این حوزه در سیستم های دانش محور، شبکه های اجتماعی و ابزارهای تحلیل داده مورد توجه قرار گرفته است.

کلیدواژه ها

استخراج اطلاعات, شناسایی رویدادها, استخراج روابط, تحلیل احساسات, مدل های زبانی بزرگ

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.