بهبود برچسب زنی متون فارسی با استفاده از روش های ترکیبی نحوی و معنایی

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 590

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

MAYCOMP02_075

تاریخ نمایه سازی: 4 مهر 1396

چکیده مقاله:

یکی از ملزومات استفاده از روش های آماری در پردازش زبان طبیعی، دسترسی به داده های زبانی شامل پیکره های متنی، پیکره های درختی، واژگان ها، بانک های صوتی و غیره می باشد. از سوی دیگر، بسیاری از زبان شناسان در پژوهش های خود از پیکره های زبانیبهره می گیرند و به بررسی ویژگی ها و کشف قواعد زبان از طریق اطلاعات موجود در داده های زبانی می پردازند. هدف از این پژوهش، بررسی چالش ها و مشکلات برچسب گذاری خودکار اجزای واژگانی کلام در زبان فارسی و استفاده از پیکره متنی زبان فارسی )پیکرهوابستگی نحوی زبان فارسی(در طراحی یک سیستم، برچسب گذاری می باشد. در این تحقیق، مدل های ترکیبی معرفی خواهند شد که بتوانند دو مسیله ی برچسب زنی اجزای سخن و تجزیه ی وابستگی را به صورت همزمان انجام دهند و در بهبود دقت برچسب زنی، تاثیر مثبتی داشته باشند. در روش پیشنهادی تلاش بر این است که با استفاده از برچسب زن نحوی ومعنایی اجزای کلام، بعد از تعیین نقش کلمات، در مدل یادگیری، برای عملکرد بهتر از چند الگوریتم یادگیری با بهترین دقت استفاده شود. الگوریتمهایی بکار رفته شامل الگوریتم های j48 ,oneR ,bysenet, navebyse میباشند.

کلیدواژه ها:

نویسندگان

فریناز رشادی

دانشجوی کارشناسی ارشد ، گروه کامپیوتر ، واحد میبد ، دانشگاه آزاد اسلامی ، میبد ، ایران

محمدجواد کارگر

عضو هیات علمی گروه کامپیوتر ، واحد میبد ، دانشگاه آزاد اسلامی ، میبد ، ایران