سامانه پایه مرجع یابی گروه های اسمی در زبان فارسی با استفاده از قوانین ساده

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 329

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DIDRAS01_014

تاریخ نمایه سازی: 26 مرداد 1397

چکیده مقاله:

مرجع یابی گروه های اسمی یکی از میان ابزارهای پردازش زبان طبیعی است که در بسیاری از سامانه های پردازش متن و زبان به کار گرفته میشود. در این مقاله چگونگی ساخت یک سامانه end-to-end مرجع یابی برای زبان فارسی تشریح شده است. این سامانه با استفاده از قوانین به نسبت ساده ای که بر روی مجموعه- ای از مشخصه-مقدار ها اعمال میشوند پیاده سازی شده است. این پژوهش برای اولین بار گروه های اسمی را به عنوان بلاک های پایه در نظر گرفته است و از این نظر اولین نمونه در نوع خود در زبان فارسی به شمار میرود. استخراج مشخصه ها در این سامانه با روش های ساده پیکره محور انجام شده است ولی معماری پیمان های این سامانه به ما اجازه میدهد که هر کدام از ابزارهای زیرساختی را به راحتی با نمونه جدیدتر آن جایگزین کنیم اما ایراد این معماری این است که خطاهای رخداده در مراحل اولیه در کل سامانه منتشر میشود و در دقت نهایی تاثیر به سزایی دارد. سامانه حاضر بر روی بخش آزمون پیکره اوپسالا آزمایش شده است و بر اساس معیار CONLL امتیاز 48,33 را به دست آورده است که میتواند به عنوان یک سامانه پایه برای مقایسه با سامانه های مشابه در نظر گرفته شود.همچنین با بهبود ابزارهای پیش پردازش استفاده شده در این سامانه این امتیاز ارتقای قابل ملاحظه ای پیدا میکند که در کارهای پیش رو انجام خواهد شد.

کلیدواژه ها:

مرجع یابی ، گروه اسمی ، ابزارهای پیش پردازش متن ، قوانین مرجعیابی

نویسندگان

شهره طباطبایی سیفی

کارشناسی ارشد زبان شناسی رایانشی، پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی، تهران

یاسر شکفته

استادیار پژوهشی، پژوهشگاه توسعه فناوریهای پیشرفته خواجه نصیرالدین طوسی، تهران