راهکاری برای قطعه بندی بدون نظارت متن در زبان فارسی

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 953

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCSE01_115

تاریخ نمایه سازی: 9 بهمن 1392

چکیده مقاله:

در این مقاله الگوریتمی برای پیدا کردن مرز بین موضوعات درون یک متن فارسی ارائه می شود که مبتنی بر انسجام کلمات و یک مدل گرافیکی با نام dotplot می باشد . سپس تغییراتی روی این الگوریتم اعمال کرده و میزان کارایی آن را افزایش داده و میانگین صحت را به مرز حدود 70 درصد می رسانیم .از طریق مشاهده نمودار و تفکیک دستی مرزهای موجود در نمودار می توان این الگوریتم را بصورت نیمه خودکار، و بااستفاده از فرمولی که در ادامه گفته می شود می توان این الگوریتم را تماماً خودکار اجرا نمود.

نویسندگان

سلمان مختارزاده شهرکی

دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر

مهدی صادق زاده

عضو هیئت علمی دانشگاه آزاد اسلامی واحد ماهشهر

روح الله دیانت

عضو هیئت علمی دانشگاه قم