ارائه یک روش ترکیبی جهت بهبود افزایش دقت دسته بندی اسناد علمی با استفاده از الگوریتم KNN و تکنیک شاخص گذاری معنایی پنهان
محل انتشار: اولین کنفرانس ملی ایده های نو در مهندسی کامیپوتر
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 966
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NICE01_030
تاریخ نمایه سازی: 30 دی 1394
چکیده مقاله:
در سال های اخیر الگوریتم های زیادی برای مساله دسته بندی اسناد، پیشنهاد شده است که از استراتژی های گوناگونی که اکثراً بر مبنای روش های باناظر می باشند، الگو گرفته اند. در واقع روش های زیادی جهت دسته بندی کردن اسناد ارائه شده اند که بدون توجه به مفاهیم نهفته درون متن، عملیات دسته بندی را انجام می دهند. تکنیک پیشنهادی ما در این مقاله این است ابتدا کلمات مهم و پرتکرار از متن اسناد علمی با استفاده از تکنیک TF-IDF بدست آمده و سپس با مقایسه با مفاهیم و کلمات کلیدی درخت سلسله مراتبی از رشته کامپیوتر، بتوان حوزه های کاری اسناد را بدست آورد و در نهایت با استفاده از یکی از تکنیک های پر کاربرد به نام LSI، از بین حوزه های تشخیص داده شده، بتوان دسته بندی را به طور تخصیص برای هر کدام از اسناد علمی انجام داد. در نهایت با استفاده از الگوریتم KNN، کار دسته بندی را انجام داد.
کلیدواژه ها:
نویسندگان
محمد کافیان
دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی واحد نجف آباد
مهدی باطنی
استادیار گروه مهندسی کامپیوتر، دانشگاه شیخ بهایی اصفهان
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :