تاثیراستفاده ازn تایی های کاراکتری باطول متفاوت بررده بندی متون فارسی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 624

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

BPJ01_527

تاریخ نمایه سازی: 29 دی 1392

چکیده مقاله:

دراین مقاله برای رده بندی متون فارسی ازN تایی های کاراکتری باطولهای متفاوت استفاده شده وتاثیر استفاده ازN تایی های با طولهای سه تا ده کاراکتر برکیفیت نتایج رده بندی مورد بررسی قرارگرفته است الگوریتم رده بندی به کارگرفته شده K- نزدیکترین همسایه است و معیارمشابهت DICE برای مقایسه متون مورداستفاده قرارگرفته است نتایج ازمایشات انجام گرفته برروی پیکره همشهری نشان میدهد که استفاده از8تایی های کاراکتری و انتخاب K=8 بهترین نتایج رده بندی را درمقایسه با سایرروشهای رده بندی متون فارسی ارایه میدهد

کلیدواژه ها:

رده بندی متون فارسی ، N تایی های کاراکتری ، K- نزدیکترین همسایه

نویسندگان

حسین مالکی نژاد

دانشگاه کاشان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • آزاده حاجی حسینی و فرشاد الماس گنج، فرده‌بندی موضوعی متون ...
  • محسن عرب سرخی و هشام فیلی، «ارائه یک سیستم دسته ...
  • _ _ _ _ and document frequency feature selection", Proc. ...
  • B. Bina, M. Ahmadi, and M. Rahgozar, "Farsi text classification ...
  • _ _ Engineering. Washington, pp.1-6, 2009. ...
  • _ _ _ _ pp.244-253, 2011. ...
  • نمایش کامل مراجع