ارائه یک روش ترکیبی جهت بهبود افزایش دقت دسته بندی اسناد علمی با استفاده از الگوریتم KNN و تکنیک شاخص گذاری معنایی پنهان

محمد کافیان; مهدی باطنی

ارائه یک روش ترکیبی جهت بهبود افزایش دقت دسته بندی اسناد علمی با استفاده از الگوریتم KNN و تکنیک شاخص گذاری معنایی پنهان

محل انتشار: اولین کنفرانس ملی ایده های نو در مهندسی کامیپوتر

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,140

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/418133

شناسه ملی سند علمی:

NICE01_030

تاریخ نمایه سازی: 30 دی 1394

چکیده مقاله:

در سال های اخیر الگوریتم های زیادی برای مساله دسته بندی اسناد، پیشنهاد شده است که از استراتژی های گوناگونی که اکثراً بر مبنای روش های باناظر می باشند، الگو گرفته اند. در واقع روش های زیادی جهت دسته بندی کردن اسناد ارائه شده اند که بدون توجه به مفاهیم نهفته درون متن، عملیات دسته بندی را انجام می دهند. تکنیک پیشنهادی ما در این مقاله این است ابتدا کلمات مهم و پرتکرار از متن اسناد علمی با استفاده از تکنیک TF-IDF بدست آمده و سپس با مقایسه با مفاهیم و کلمات کلیدی درخت سلسله مراتبی از رشته کامپیوتر، بتوان حوزه های کاری اسناد را بدست آورد و در نهایت با استفاده از یکی از تکنیک های پر کاربرد به نام LSI، از بین حوزه های تشخیص داده شده، بتوان دسته بندی را به طور تخصیص برای هر کدام از اسناد علمی انجام داد. در نهایت با استفاده از الگوریتم KNN، کار دسته بندی را انجام داد.

کلیدواژه ها:

دسته بندی متون ، متن کاوی ، پردازش زبان طبیعی ، الگوریتم KNN

نویسندگان

محمد کافیان

دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی واحد نجف آباد

مهدی باطنی

استادیار گروه مهندسی کامپیوتر، دانشگاه شیخ بهایی اصفهان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Liu, Tao, et al. "Improving text classification using local latent ...
M. Granitzer, "Hierarchical text classification using methods from machine learning" ...
CLEVERDON, C. 1984. Optimizing convenient online access to bibliographic databases. ...
PAZIENZA, M. T., ed. 1997. Information Extraction. Lecture Notes in ...
KNIGHT, K. 1999. Mining online text. Commun. ACM 42, I1, ...
Alessandro Moschitti, "Answer Filtering via Text Categorization in Question Answering ...
Huang, Y. "Support vector machines for text categorization based _ ...
Slonim, N., Tishby, N., "Document Clustering using Word Cluster via ...
Steinbach, M., Karypis, G., Kumar, V., _ Comparison of Document ...
Dumais, S., et l. "Latent semantic indexing." Proceedings of the ...
De Lathauwer, L., et al. "Singular Value Decompo sition. _ ...
MANNNG, C. AND SCH:UTZE, H. 1999. Foundations of Statistical Natural ...
BORKO, H. AND BERNICK, M. 1963. Automatic document classification. J. ...
MERKL, D. 1998. Text classification with selforganizing maps: Some lessonslearne. ...
MARON, M. 1961. Automatic indexing: an experimental inquiry. J. Assoc. ...
SCHAPIRE, R. E. ANDD SINGER, Y. 2000. BoosTexter: a boosting-based ...
MYERS, K., KEARNS, M., SINGH, S., AND WALKER, M. A. ...
SABLE, C. L. AND HATZIVAS SILOGLOU, V. 2000. Textbased approaches ...
FORSYTH, R. S. 1999. New directions in text categorization. In ...
CAVNAR, W. B. AND TRENKLE, J. M. 1994. N-grambased text ...
KESSLER, B., NUNBERG, G., AND SCHUTZE, H. 1997. Automatic detection ...
FABRIZIO SEBASTIANI, "Machine Learning in Automated Text Categorization" , ACM ...
Li, B., Lu, Q., Yu, S., "An Adaptive k-Nearest Neighbor ...
Lin, Y, Qu, Y, Wang, Z., "A novel feature selection ...
Shang, W., Huang, H., Zhu, H., & Lin, Y., _ ...
Deerwester, S. C., Dumais, S. T., Landauer, T. K, . ...
Hofmann, R., "Probabilistic Latent Semantic Analysis, " in Proc. 15th ...
Lewis D.D. , Nive(Bayes) at Forty, The independence Assumption in ...
Dagan I., Engleson P, Committee -Based sampling for Training Probabilistic ...
Krotha, Rachitha Sony, and Madhavi Dabbiru. "A Novel Approach for ...
Rafi, Muhammad, and Mohammad Shahid Shaik. "An improved semantic similarity ...

نمایش کامل مراجع