شناسایی موجودیت های اسمی: گام اول در فرایند استخراج اطلاعات

سال انتشار: 1397
محل انتشار: سومین کنفرانس ملی در مهندسی کامپیوتر، فناوری اطلاعات و پردازش داده ها
کد COI اختصاصی: CITCOMP03_146
زبان مقاله: فارسی
تعداد مشاهده: 875

دانلود فایل این مقاله

نویسندگان

زینب بلالی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر- نرم افزار گروه کامپیوتر، واحد بندرعباس، دانشگاه آزاد اسلامی، بندرعباس، ایران

عباس عکاسی

هییت علمی گروه کامپیوتر، واحد بندرعباس، دانشگاه آزاد اسلامی، بندرعباس، ایران

معصومه طالبی فرد

دانشجوی کارشناسی ارشد مهندسی کامپیوتر- نرم افزارگروه کامپیوتر، واحد بندرعباس، دانشگاه آزاد اسلامی، بندرعباس، ایران

چکیده

شناسایی موجودیتهای اسمی یکی از حوزه های پژوهشی پردازش زبان طبیعی و استخراج اطلاعات به حساب می آید که در آن موجودیتهای اسمی، شناسایی و دستهبندی میشوند. تشخیص دقیق و درست موجودیتهای اسمی از اهمیت زیادی برخوردار است، کارایی عملیات تشخیص موجودیت های اسمی در حوزه های مختلف پردازش زبان طبیعی نظیر ترجمه خودکار ماشین، بازیابی اطلاعات، رفع ابهام معنایی کلمات، پرسش و پاسخ، تشخیص روابط و خوشه بندی متن تاثیر اساسی و بسزایی دارد و برای حل بسیاری از مشکلات در این زمینه ها میتواند بسیار اثربخش باشد. در این مقاله مروری بر روشهای شناسایی موجودیتهای اسمی در زبان انگلیسی، فارسی و عربی از ابتدا تا سالهای اخیر داشته وهمچنین گریزی بر ویژگیهای موجودیت های اسمی نیز شده است. تلاش بر این بوده تا حدالامکان روشهای جدید مورد استفاده در این فرایند معرفی گردند.

کلیدواژه ها

تشخیص موجودیتهای اسمی ،یادگیری ماشین، پردازش زبان طبیعی، استخراج اطلاعات

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.