استخراج خودکار رده بندی موجودیت های اسمی با استفاده از گراف شمول معنایی

  • سال انتشار: 1393
  • محل انتشار: هشتمین کنفرانس ملی فرماندهی و کنترل ایران (C۴I)
  • کد COI اختصاصی: CCCI08_015
  • زبان مقاله: فارسی
  • تعداد مشاهده: 797
دانلود فایل این مقاله

نویسندگان

مسعود پیریایی

دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه صنعتی مالک اشتر

حسن شیرازی

دانشیار و عضو هیات علمی دانشگاه صنعتی مالک اشتر

چکیده

موضوع تشخیص واحد های اسمی در متن و تعیین نوع طبقه ی آنها یکی از مسائل مهم و کاربردی در حوزه ی پردازش زبان های طبیعی و همچنین بازیابی اطلاعات است. به طور کلی تشخیص واحد های اسمی و همچنین طبقه ی آنها در متن دارای فراز و فرود هایی از ابتدا تا به امروز بوده است. با پیشرفت روزافزون در حوزه ی پردازش متن قابلیت انتخاب یک طبقه ی تعیین شده برای موجودیت های اسمی افزایش یافت و دیگر روش های قدیمی تر برای تعیین یک طبقه بندی کلی برای اسامی راه گشای بعضی از نیاز های این حوزه نبود. در این مقاله روشی برای استخراج دسته بندی هر موجودیت اسمی با استفاده از ساخت گراف شمول معنایی از یک متن بدون ساختار ارایه داده شده است . گراف شمول معنایی گرافی است که رازهای آن مفاهیم کلیدی موجود در متن و یالهای آن بیانگر وجود رابطه شمول معنایی بین دو مفهوم می باشد . رابطه شمول معنایی به رابطه ی بین دو مفهوم گفته می شود که در آن یکی از مفاهیم از لحاظ معنایی شامل مفهوم دیگر باشد. رابطه شمول معنایی به دو دسته کل - جز و عام - خاص تقسیم می شود، رابطه کل - جز به رابطه ای گفته می شود که در آن یکی از مفاهیم جزی از مفهوم دیگر باشد مانند رابطه بین تیم و بازیکن رابطه ی عام-خاص به رابطه ی گفته می شود که در آن یکی از مفاهیم از لحاظ معنایی شامل مفهوم دیگر باشد مانند رابطه شهر و تهران . در کارهای قبلی گراف شمول معنایی، با استفاده از کلمات موجود در متن ساخته شده است. ولی در این مقاله گراف شمول معنایی بر اساس معانی کلمات ساخته می شود. در این مقاله یک روش جدید برای ساخت گراف و همچنین استخراج روابطی که صراحتا در متن وجود ندارند ارایه شده است. نتایج بدست آمده در این مقاله بیانگر این است که منابع دانش رده بندی لغوی مانند وردنت که به صورت دستی ساخته شده است را می توان به صورت خودکار استخراج کرد

کلیدواژه ها

هوش مصنوعی ، رده بندی موجودیت های اسمی ، گراف شمول معنایی ، پردازش زبان های طبیعی ، رفع ابهام

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.