بررسی و ارزیابی رویکردهای شناسایی موجودیت ها
محل انتشار: چهارمین همایش ملی علوم و فناوری های نوین ایران
سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 437
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
PFCONF04_184
تاریخ نمایه سازی: 6 مهر 1397
چکیده مقاله:
یکی از چالشهای اساسی در جامعه اطلاعاتی موضوع شناسایی موجودیتها است. موضوع تشخیص و شناسایی موجودیتها و تعیین نوع طبقه آنها یکی از مسایل مهم و کاربردی در حوزه پردازش زبانهای طبیعی و همچنین بازیابی اطلاعات است. اولین مرحله در مبحث ا ستخراج اطلاعات، ت شخیص و د سته بندی موجودیتها در متن ا ست. بیشتر سامانه های تشخیص موجودیت به سمت پیدا نمودن ا سامی ا شخاص، مکانها و سازمانها تمرکز دارند. شیوه های ما شینی و ان سانی مختلفی جهت شنا سایی موجودیت ها تاکنون تو سط متخ ص صان در این حوزه مطرح شده ا ست، اما تمامی روشهای مبتنی بر ما شین محدودیتهایی مانند عدم دقت لازم و عدم ا ستفاده از جمع سپاری را دارند و به همین جهت محققان به سمت ا ستفاده از شیوه های مبتنی بر انسان با قابلیت جمع سپاری برای حل این مسایل حرکت کرده اند. این روشها نیز به خاطر استفاده از کارگران انسانی دارای هزینه بالایی است. جهت غلبه بر این محدودیتها و بهبود عملکرد شنا سایی موجودیتها از رویکرد ترکیبی ما شین _ ان سان ا ستفاده می شود که در این مقاله در رویکرد ترکیبی ابتدا از شیوه ماشینی simjoin برای شناسایی موجودیتها استفاده کرده و خروجی آن را به رویکرد انسانی با چهارچوب AMT برای ادامه مسیله شنا سایی میدهیم. نتایج آزمایشها روی مجموعه داده ها ن شان میدهد که رویکرد ترکیبی دقت بالاتری در مقای سه با شیوه های فقط ما شینی یا انسانی کسب میکند. ضمن اینکه در رویکرد ترکیبی زمان شنا سایی موجودیتها کاهش پیدا کرده و همچنین ریزوظایف کمتری نسبت به الگوریتمهای مورد مقایسه تولید شده که باعث کاهش هزینه شناسایی میگردد.
کلیدواژه ها:
نویسندگان
حمیدرضا مدرسی
دانشجوی کارشناسی ارشد دانشکده و پژوهشکده مهندسی فناوری اطلاعات دانشگاه جامع امام حسین(ع
مجید غیوری ثالث
استادیار دانشکده و پژوهشکده مهندسی فناوری اطلاعات دانشگاه جامع امام حسین(ع)