ارائه و بهسازی مدل توأم برچسب زنی اجزای سخن و تجزیه ی وابستگی زبان فارسی

  • سال انتشار: 1393
  • محل انتشار: دومین همایش ملی پژوهش های کاربردی در علوم کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: CITCONF02_055
  • زبان مقاله: فارسی
  • تعداد مشاهده: 738
دانلود فایل این مقاله

نویسندگان

عاطفه پاکزاد

دانشگاه علم و صنعت ایران، دانشکده مهندسی کامپیوتر

مجتبی خلاش

فارغ التحصیل کارشناسی ارشد دانشگاه علم و صنعت ایران، دانشکده مهندسی کامپیوتر

بهروز مینایی بیدگلی

عضو هیئت علمی دانشگاه دانشگاه علم و صنعت ایران، دانشکده مهندسی کامپیوتر

چکیده

موضوع تجزیه وابستگی راهی برای تجزیه نحوی زبان طبیعی است که به صورت خودکار به تجزیه و تحلیل ساختار وابستگی جملات پرداخت و برای هر جمله ورودی یک گراف وابستگی ایجاد می کند. برچسب زنی اجزای سخن برای انجام تجزیه وابستگی یک پیش نیاز است. عموماً تجزیه گرهای وابستگی به صورت مرحله ای پیوسته، وظایف برچسب زنی و تجزیه وابستگی را به صورت دوگانه متوالی انجام می دهند. در این مدل ها خطای ناشی از برچسب زنی در تجزیه وابستگی انتشار می یابد، همچنین در حین برچسب زنی از اطلاعات مفید نحوی استفاده نمی کند. هدف از ارائه روش های تو هم، کاهش هم زمان خطای هر دو وظیفه برچسب زنی اجزای سخن و تجزیه وابستگی است. در این پژوهش برای اولین بار مدل توام بر روی زبان فارسی با استفاده از نرم افزار corbit نمایش قرار گرفته و ویژگی های مدل بر دو زبان فارسی بهینه سازی شده که سبب بهبود در دقت مدل توام گردیده است. نرم افزار corbit باد سایه یک روش توام مبتنی بر گزار ن برای وظایف تقسیم بندی کلمه، برچسب زنی اجزای سخن و تجزیه وابستگی است … در این پژوهش به دست توام برچسب زنی اجزای سخن و اتصال بدون برچسب تجزیه وابستگی برای برچسب های داشت و روی داد آزمون برابر 85.59 در صد و برای برچسب های ریز 84.24 در صد به دست آمده است .

کلیدواژه ها

مدل توأم، اجزای سخن ، تجزیهی وابستگی ، زبان فارسی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.