دسته بندی متون به کمک الگوریتم KNN بهبود یافته مبتنی بر خوشه های وزن دار
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,857
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CEIT01_175
تاریخ نمایه سازی: 9 تیر 1393
چکیده مقاله:
دسته بندی متون یکی از شاخه های متن کاوی است که به طور خودکار متون را طبقه بندی می نماید. تاکنون روشهای مفید بسیاری با رویکرد رده بندی مبتنی بر ناظر برای دسته بندی متون معرفی شده اند. در بین این روشها الگوریتم K نزدیکترین همسایه یا KNN به طور وسیع مورد استفاده قرار می گیرد، که به علت سادگی و بی پارامتر بودن و کارایی دسته بندی ( دقت دسته بندی) آن یکی از بهترین روشها است. اما روش سنتی KNN پیچیدگی محاسباتی بالایی دارد و این نقیصه از کاربردی بودن KNN می کاهد. خوشه بندی یک راه حل برای این مشکل است، به این روش که تعداد نمونه های یادگیری در دسته بندی را کاهش می دهد و به این طریق از پیچیدگی زمانی محاسبات می کاهد. در این مقاله، ما یکی از روشهای ساده مبتنی برای خوشه بندی الگوریتم KNN را که قبلا پیشنهاد شده است، انتخاب کرده ایم. این روش بوسیله خوشه بندی پیچیدگی زمانی را تا حد زیادی کاهش می دهد ولی مقداری از کارایی دسته بندی می کاهد. ما یک مقدار وزنی به مرکز خوشه ها نسبت می دهیم و همچنین مقدار K در الگوریتم KNN را کاهش می دهیم . آزمایشها برروی مجموعه داده محک Reuter-21578 نشان می دهد که این روش می تواند کارایی دسته بندی را افزایش دهد.
کلیدواژه ها:
نویسندگان
زهرا صفیان بلداجی
دانشجوی کارشناسی ارشد مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد نجف آباد، نجف آباد
محمد نادری دهکردی
استادیار گروه کارشناسی ارشد نرم افزاز دانشگاه آزاد اسلامی واحد نجف آباد، نجف آباد،
حمید رستگار
استادیار گروه کارشناسی ارشد نرم افزاز دانشگاه آزاد اسلامی واحد نجف آباد، نجف آباد،
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :