الگوریتمی جدید برای طبقه بندی مستندات فارسی، مبتنی بر وزن دهی به ویژگی ها وفایل ها
محل انتشار: کنفرانس بین المللی مهندسی و علوم کاربردی
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 670
فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEASCONF01_086
تاریخ نمایه سازی: 9 مرداد 1395
چکیده مقاله:
با توجه به حجم روز افزون اطلاعات در دنیای کنونی، نیاز به ابزارهای قدرتمند جدید برای تبدیل داده به دانش مفید افزایش یافته است. یکی از روش ه ای حیاتی کنترل و مدیریت داده ها، طبقه بندی متون می باشد. در این مقاله الگوریتمی برای طبقه بندی مستندات فارسی ارائه شده است، که دارای قابلیت هایی همچون کنترل وزن دهی به ویژگی ها با روش وزن دهی مبتنی ؛F کیفیت دسته بندی ایجاد شده بر اساس بازخورد معیار ارزیابی بر طبقات و همچنین اختصاص دادن وزن به هر فایل در تمامی طبقات و انتقال فایل به طبقه ای که وزنبیشتری در آن طبقه دارد؛ می باشد. این روند باعث می شود حذف کلمات زائد به دلیل بهبود در کلاس ها با کیفیت بالا تری انجام شود. در نهایت الگوریتم را مورد ارزیابی قرار می دهیم؛ به این صورت که ابتدا تاثیر طبقه بندی تصادفی اولیه ی متفاوت، سپس تاثیر روش های مختلف وزن دهی TFCRF،TFRF،TFIDF و روش وزن دهی پیشنهادی را بر روی خروجی الگوریتم طبقه بندی پیشنهادی مورد بررسی قرار می دهیم. نتایج نشان می دهد، تمامی موارد ذکر شده به صورت تجمعی باعث افزایش کیفیت و دقت در طبقه بندی می شود.
کلیدواژه ها:
نویسندگان
محبوبه ضیایی
آموزشکده فنی و حرفه ای سماء، دانشگاه آزاد اسلامی، واحد کازرون، کازرون، ایران
مریم محمدی
آموزشکده فنی و حرفه ای سماء، دانشگاه آزاد اسلامی، واحد کازرون، کازرون، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :