ارائه و بهسازی مدل توأم برچسب زنی اجزای سخن و تجزیه ی وابستگی زبان فارسی
- سال انتشار: 1393
- محل انتشار: دومین همایش ملی پژوهش های کاربردی در علوم کامپیوتر و فناوری اطلاعات
- کد COI اختصاصی: CITCONF02_055
- زبان مقاله: فارسی
- تعداد مشاهده: 793
نویسندگان
دانشگاه علم و صنعت ایران، دانشکده مهندسی کامپیوتر
فارغ التحصیل کارشناسی ارشد دانشگاه علم و صنعت ایران، دانشکده مهندسی کامپیوتر
عضو هیئت علمی دانشگاه دانشگاه علم و صنعت ایران، دانشکده مهندسی کامپیوتر
چکیده
موضوع تجزیه وابستگی راهی برای تجزیه نحوی زبان طبیعی است که به صورت خودکار به تجزیه و تحلیل ساختار وابستگی جملات پرداخت و برای هر جمله ورودی یک گراف وابستگی ایجاد می کند. برچسب زنی اجزای سخن برای انجام تجزیه وابستگی یک پیش نیاز است. عموماً تجزیه گرهای وابستگی به صورت مرحله ای پیوسته، وظایف برچسب زنی و تجزیه وابستگی را به صورت دوگانه متوالی انجام می دهند. در این مدل ها خطای ناشی از برچسب زنی در تجزیه وابستگی انتشار می یابد، همچنین در حین برچسب زنی از اطلاعات مفید نحوی استفاده نمی کند. هدف از ارائه روش های تو هم، کاهش هم زمان خطای هر دو وظیفه برچسب زنی اجزای سخن و تجزیه وابستگی است. در این پژوهش برای اولین بار مدل توام بر روی زبان فارسی با استفاده از نرم افزار corbit نمایش قرار گرفته و ویژگی های مدل بر دو زبان فارسی بهینه سازی شده که سبب بهبود در دقت مدل توام گردیده است. نرم افزار corbit باد سایه یک روش توام مبتنی بر گزار ن برای وظایف تقسیم بندی کلمه، برچسب زنی اجزای سخن و تجزیه وابستگی است … در این پژوهش به دست توام برچسب زنی اجزای سخن و اتصال بدون برچسب تجزیه وابستگی برای برچسب های داشت و روی داد آزمون برابر 85.59 در صد و برای برچسب های ریز 84.24 در صد به دست آمده است .کلیدواژه ها
مدل توأم، اجزای سخن ، تجزیهی وابستگی ، زبان فارسیمقالات مرتبط جدید
- بررسی عددی تاثیر لایه مرزی بر عملکرد انتقال حرارت و افت فشار در مبدل های حرارتی
- Quantitative Insights into G Protein Signaling: A Review of Recent SPR Methodologies and Discoveries
- استفاده از دو الگوریتم رمزنگاری AES و DES در راستای افزایش امنیت اطلاعات در شبکه های حسگر بیسیم
- پیشنهاد الگوریتم های بهینه سازی برای طراحی گراف های پیچیده با استفاده از شبکه های مولد (GAN)
- طراحی و ارزیابی مدل های تحلیلی برای تسریع فرایند های تصمیم گیری در تحلیل داده های بزرگ به کمک تکنیک یادگیری ماشین
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.