بررسی و ارزیابی رویکردهای شناسایی موجودیت ها

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 457

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

PFCONF04_184

تاریخ نمایه سازی: 6 مهر 1397

چکیده مقاله:

یکی از چالشهای اساسی در جامعه اطلاعاتی موضوع شناسایی موجودیتها است. موضوع تشخیص و شناسایی موجودیتها و تعیین نوع طبقه آنها یکی از مسایل مهم و کاربردی در حوزه پردازش زبانهای طبیعی و همچنین بازیابی اطلاعات است. اولین مرحله در مبحث ا ستخراج اطلاعات، ت شخیص و د سته بندی موجودیتها در متن ا ست. بیشتر سامانه های تشخیص موجودیت به سمت پیدا نمودن ا سامی ا شخاص، مکانها و سازمانها تمرکز دارند. شیوه های ما شینی و ان سانی مختلفی جهت شنا سایی موجودیت ها تاکنون تو سط متخ ص صان در این حوزه مطرح شده ا ست، اما تمامی روشهای مبتنی بر ما شین محدودیتهایی مانند عدم دقت لازم و عدم ا ستفاده از جمع سپاری را دارند و به همین جهت محققان به سمت ا ستفاده از شیوه های مبتنی بر انسان با قابلیت جمع سپاری برای حل این مسایل حرکت کرده اند. این روشها نیز به خاطر استفاده از کارگران انسانی دارای هزینه بالایی است. جهت غلبه بر این محدودیتها و بهبود عملکرد شنا سایی موجودیتها از رویکرد ترکیبی ما شین _ ان سان ا ستفاده می شود که در این مقاله در رویکرد ترکیبی ابتدا از شیوه ماشینی simjoin برای شناسایی موجودیتها استفاده کرده و خروجی آن را به رویکرد انسانی با چهارچوب AMT برای ادامه مسیله شنا سایی میدهیم. نتایج آزمایشها روی مجموعه داده ها ن شان میدهد که رویکرد ترکیبی دقت بالاتری در مقای سه با شیوه های فقط ما شینی یا انسانی کسب میکند. ضمن اینکه در رویکرد ترکیبی زمان شنا سایی موجودیتها کاهش پیدا کرده و همچنین ریزوظایف کمتری نسبت به الگوریتمهای مورد مقایسه تولید شده که باعث کاهش هزینه شناسایی میگردد.

نویسندگان

حمیدرضا مدرسی

دانشجوی کارشناسی ارشد دانشکده و پژوهشکده مهندسی فناوری اطلاعات دانشگاه جامع امام حسین(ع

مجید غیوری ثالث

استادیار دانشکده و پژوهشکده مهندسی فناوری اطلاعات دانشگاه جامع امام حسین(ع)