راهکاری برای قطعه بندی بدون نظارت متن در زبان فارسی
محل انتشار: همایش ملی علوم و مهندسی کامپیوتر
سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 953
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCCSE01_115
تاریخ نمایه سازی: 9 بهمن 1392
چکیده مقاله:
در این مقاله الگوریتمی برای پیدا کردن مرز بین موضوعات درون یک متن فارسی ارائه می شود که مبتنی بر انسجام کلمات و یک مدل گرافیکی با نام dotplot می باشد . سپس تغییراتی روی این الگوریتم اعمال کرده و میزان کارایی آن را افزایش داده و میانگین صحت را به مرز حدود 70 درصد می رسانیم .از طریق مشاهده نمودار و تفکیک دستی مرزهای موجود در نمودار می توان این الگوریتم را بصورت نیمه خودکار، و بااستفاده از فرمولی که در ادامه گفته می شود می توان این الگوریتم را تماماً خودکار اجرا نمود.
کلیدواژه ها:
نویسندگان
سلمان مختارزاده شهرکی
دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر
مهدی صادق زاده
عضو هیئت علمی دانشگاه آزاد اسلامی واحد ماهشهر
روح الله دیانت
عضو هیئت علمی دانشگاه قم