بهبود برچسب زنی متون فارسی با استفاده از روش های ترکیبی نحوی و معنایی

فریناز رشادی; محمدجواد کارگر

بهبود برچسب زنی متون فارسی با استفاده از روش های ترکیبی نحوی و معنایی

محل انتشار: دومین همایش چشم انداز تکنولوژی کامپیوتر و شبکه در 2030

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 849

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

صنعت اتصال > چسب و رزین

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/655033

شناسه ملی سند علمی:

MAYCOMP02_075

تاریخ نمایه سازی: 4 مهر 1396

چکیده مقاله:

یکی از ملزومات استفاده از روش های آماری در پردازش زبان طبیعی، دسترسی به داده های زبانی شامل پیکره های متنی، پیکره های درختی، واژگان ها، بانک های صوتی و غیره می باشد. از سوی دیگر، بسیاری از زبان شناسان در پژوهش های خود از پیکره های زبانیبهره می گیرند و به بررسی ویژگی ها و کشف قواعد زبان از طریق اطلاعات موجود در داده های زبانی می پردازند. هدف از این پژوهش، بررسی چالش ها و مشکلات برچسب گذاری خودکار اجزای واژگانی کلام در زبان فارسی و استفاده از پیکره متنی زبان فارسی )پیکرهوابستگی نحوی زبان فارسی(در طراحی یک سیستم، برچسب گذاری می باشد. در این تحقیق، مدل های ترکیبی معرفی خواهند شد که بتوانند دو مسیله ی برچسب زنی اجزای سخن و تجزیه ی وابستگی را به صورت همزمان انجام دهند و در بهبود دقت برچسب زنی، تاثیر مثبتی داشته باشند. در روش پیشنهادی تلاش بر این است که با استفاده از برچسب زن نحوی ومعنایی اجزای کلام، بعد از تعیین نقش کلمات، در مدل یادگیری، برای عملکرد بهتر از چند الگوریتم یادگیری با بهترین دقت استفاده شود. الگوریتمهایی بکار رفته شامل الگوریتم های j48 ,oneR ,bysenet, navebyse میباشند.

کلیدواژه ها:

برچسب گذاری اجزای کلام ، پیکره زبان فارسی ، تجزیهی وابستگی ، برچسب گذاری نحوی

نویسندگان

فریناز رشادی

دانشجوی کارشناسی ارشد ، گروه کامپیوتر ، واحد میبد ، دانشگاه آزاد اسلامی ، میبد ، ایران

محمدجواد کارگر

عضو هیات علمی گروه کامپیوتر ، واحد میبد ، دانشگاه آزاد اسلامی ، میبد ، ایران