دسته بندی متون به کمک الگوریتم KNN بهبود یافته مبتنی بر خوشه های وزن دار

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,757

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEIT01_175

تاریخ نمایه سازی: 9 تیر 1393

چکیده مقاله:

دسته بندی متون یکی از شاخه های متن کاوی است که به طور خودکار متون را طبقه بندی می نماید. تاکنون روشهای مفید بسیاری با رویکرد رده بندی مبتنی بر ناظر برای دسته بندی متون معرفی شده اند. در بین این روشها الگوریتم K نزدیکترین همسایه یا KNN به طور وسیع مورد استفاده قرار می گیرد، که به علت سادگی و بی پارامتر بودن و کارایی دسته بندی ( دقت دسته بندی) آن یکی از بهترین روشها است. اما روش سنتی KNN پیچیدگی محاسباتی بالایی دارد و این نقیصه از کاربردی بودن KNN می کاهد. خوشه بندی یک راه حل برای این مشکل است، به این روش که تعداد نمونه های یادگیری در دسته بندی را کاهش می دهد و به این طریق از پیچیدگی زمانی محاسبات می کاهد. در این مقاله، ما یکی از روشهای ساده مبتنی برای خوشه بندی الگوریتم KNN را که قبلا پیشنهاد شده است، انتخاب کرده ایم. این روش بوسیله خوشه بندی پیچیدگی زمانی را تا حد زیادی کاهش می دهد ولی مقداری از کارایی دسته بندی می کاهد. ما یک مقدار وزنی به مرکز خوشه ها نسبت می دهیم و همچنین مقدار K در الگوریتم KNN را کاهش می دهیم . آزمایشها برروی مجموعه داده محک Reuter-21578 نشان می دهد که این روش می تواند کارایی دسته بندی را افزایش دهد.

نویسندگان

زهرا صفیان بلداجی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد نجف آباد، نجف آباد

محمد نادری دهکردی

استادیار گروه کارشناسی ارشد نرم افزاز دانشگاه آزاد اسلامی واحد نجف آباد، نجف آباد،

حمید رستگار

استادیار گروه کارشناسی ارشد نرم افزاز دانشگاه آزاد اسلامی واحد نجف آباد، نجف آباد،

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • [1] Chen T, Xie Y Q, Reviewv of Feature Reduction ...
  • [2] Su Jinshu, Zhang Bofeng, Xu Xin, Advances in Machine ...
  • Information, 24 (6): 690-684., 2005 ...
  • [3] Fang Lu, Qingyuan Bai, A Refined Weighted K- Nearest ...
  • _ _ _ _ _ _ K-NN Text classification, Proceedings ...
  • [5] Li Juan, TKNN: _ improved KNN algorithm based on ...
  • [6] Imad Rahal , William Perrizo, An Optimized Approach for ...
  • [7] Lijuan Zhou, Linshuang Wang, Xuebin Ge and Qian Shi, ...
  • _ _ _ _ Cluster in Text Classification, IEEE, International ...
  • _ _ Yuan Jiao, Text Categorization Research Based on Cluster ...
  • [10] XindongWu : Vipin Kumar And others, Top 10 algorithms ...
  • [11] Luigi Galavotti, Fabrizio Sebastiani, and Maria Simi, Experiments on ...
  • Computer Science: series, number 1923. ...
  • نمایش کامل مراجع