ارائه و بهسازی مدل توأم برچسب زنی اجزای سخن و تجزیه ی وابستگی زبان فارسی
- سال انتشار: 1393
- محل انتشار: دومین همایش ملی پژوهش های کاربردی در علوم کامپیوتر و فناوری اطلاعات
- کد COI اختصاصی: CITCONF02_055
- زبان مقاله: فارسی
- تعداد مشاهده: 815
نویسندگان
دانشگاه علم و صنعت ایران، دانشکده مهندسی کامپیوتر
فارغ التحصیل کارشناسی ارشد دانشگاه علم و صنعت ایران، دانشکده مهندسی کامپیوتر
عضو هیئت علمی دانشگاه دانشگاه علم و صنعت ایران، دانشکده مهندسی کامپیوتر
چکیده
موضوع تجزیه وابستگی راهی برای تجزیه نحوی زبان طبیعی است که به صورت خودکار به تجزیه و تحلیل ساختار وابستگی جملات پرداخت و برای هر جمله ورودی یک گراف وابستگی ایجاد می کند. برچسب زنی اجزای سخن برای انجام تجزیه وابستگی یک پیش نیاز است. عموماً تجزیه گرهای وابستگی به صورت مرحله ای پیوسته، وظایف برچسب زنی و تجزیه وابستگی را به صورت دوگانه متوالی انجام می دهند. در این مدل ها خطای ناشی از برچسب زنی در تجزیه وابستگی انتشار می یابد، همچنین در حین برچسب زنی از اطلاعات مفید نحوی استفاده نمی کند. هدف از ارائه روش های تو هم، کاهش هم زمان خطای هر دو وظیفه برچسب زنی اجزای سخن و تجزیه وابستگی است. در این پژوهش برای اولین بار مدل توام بر روی زبان فارسی با استفاده از نرم افزار corbit نمایش قرار گرفته و ویژگی های مدل بر دو زبان فارسی بهینه سازی شده که سبب بهبود در دقت مدل توام گردیده است. نرم افزار corbit باد سایه یک روش توام مبتنی بر گزار ن برای وظایف تقسیم بندی کلمه، برچسب زنی اجزای سخن و تجزیه وابستگی است … در این پژوهش به دست توام برچسب زنی اجزای سخن و اتصال بدون برچسب تجزیه وابستگی برای برچسب های داشت و روی داد آزمون برابر 85.59 در صد و برای برچسب های ریز 84.24 در صد به دست آمده است .کلیدواژه ها
مدل توأم، اجزای سخن ، تجزیهی وابستگی ، زبان فارسیمقالات مرتبط جدید
- سودآوری مشتریان در خردهفروشی قطعات یدکی ماشین آلات راهسازی با رویکرد یادگیری ماشین
- ارائه روشی کارآمد جهت شناسایی کودکان نیازمند به پیوند مغز استخوان با استفاده از ترکیب طبقه بند ماشین بردار پشتیبان و الگوریتم بهینه سازی فاخته
- استخراج بهینه پارامترهای تاثیر گذار الگوریتم بهینه سازی بوفالوی آفریقایی با هدف استخراج ویژگی های مهم به منظور افزایش کارایی طبقه بندی داده ها
- ارائه روشی کارآمد برای بهبود عملکرد الگوریتم بهینه سازی کلاغ سیاه به منظور افزایش صحت خوشه بندی داده ها
- استفاده از الگوریتم باور بیزین در لایه کاملا متصل شبکه عصبی کانولوشن با هدف افزایش دقت تشخیص تصاویر
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.