طبقه بندی متون فارسی با استفاده از الگوریتم SVM

معصومه یکتاکیش; سمیه مختاری فر; مجید کشاورز

طبقه بندی متون فارسی با استفاده از الگوریتم SVM

فایل این در 49 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل

من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این :

https://civilica.com/doc/2280951

چکیده :

با رشد روزافزون اطلاعات متنی در فضای مجازی، نیاز به روش هایی برای سازمان دهی و طبقه بندی خودکار این داده ها بیش از پیش احساس می شود. طبقه بندی متون، یکی از شاخه های مهم در حوزه بازیابی اطلاعات و پردازش زبان طبیعی )NLP )است که هدف آن تعیین دسته یا برچسب مناسب برای یک سند متنی می باشد. در زبان فارسی، به دلیل پیچیدگی های ساختاری، کمبود منابع پردازشی و چالشهای خاص زبانی، طبقه بندی خودکار متون با مشکلاتی مواجه است. در این پژوهش، به بررسی و پیاده سازی فرآیند طبقه بندی متون فارسی با استفاده از الگوریتم ماشین بردار پشتیبان ) SVM )پرداخته شده است. در چنین شرایطی ، تحلیل و سازمان دهی این حجم عظیم از اطلاعات، بدون بهره گیری از ابزارهای هوشمند پردازش زبان طبیعی عملا غیرممکن است. یکی از مهم وظایف در این حوزه پردازش زبان طبیعی است فرایندی که طی آن یک سیستم هوشمند میکوشد تا متن ورودی را به یکی از دسته های از پیش تعریف شده نسبت دهد. این مسئله در کاربردهایی نظیر فیلترینگ اخبار، سامانه های پیشنهاد دهنده، تحلیل احساسات کاربران و سازمان دهی خودکار اسناد، نقش کلیدی دارد.

کلیدواژه ها:

طبقه بندی متن ، زبان فارسی ، یادگیری ماشین ، ماشین بردار پشتیبان ) SVM ، )پیش پردازش متن ، IDF-TF ، پردایش زبان طبیعی )NLP )

نویسندگان

معصومه یکتاکیش

استاد مسئول

سمیه مختاری فر

دانشجو

مجید کشاورز

عضو هیئت علمی

مراجع و منابع این :

لیست زیر مراجع و منابع استفاده شده در این را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود لینک شده اند :

فهرست منابع ...
M. Mohammadi, M. Esmaeilpour, and M. Abolhassani, "A comparative study ...
classification algorithms using Persian documents", International Journal of Computer ...
.)2012( ,Applications, Vol. 42, No. 10, pp. 6–13 ...
]2 ]سید حرین سیدین، "مدلسایی انتقال حرارت و انجماد در ...
رول سرب ا کلریم"، گزارش قرارداد تحقیقاتی، شهریور 1380 . ...
S. Bird, E. Klein, and E. Loper, Natural Language Processing ...
.)2009 ( ,Media Inc., 1st Edition ...
Clough, R. W., and Penizien, J. (2003). Dynamics of Structures, ...
.Computers & Structures Inc., Berkeley, CA ...
International Communication Consultants (1993). A hypertext history of multi‐user ]5[ ...
.Dec. 5 ,dimensions, http://www.ccs.neu.edu ...
Itasca (1982). Fast Largrangian Analysis of Continum Media‐ FLAC, Ver. ...
.Itasca Ltd ...
]7 ]رویا سادات موسوی و سید حمیدرضا میرشفیعی، "طبقه بندی ...
یادگیری ماشین"، فصلنامه پردایش هوشمند اطشعات و سیرتمها، سال 7 ...
.1390 پاییز، 58 ...
]8 ]امین رضایی، "بررسی الگوریتم های داده کاوی در طبقه ...
کارشناسی ارشد، دانشگاه صنعتی شریو، 1395 . ...
Y. Yang and X. Liu, "A re-examination of text categorization ...
of the 22nd Annual International ACM SIGIR Conference on Research ...
.)1999( ,in Information Retrieval, pp. 42–49 ...
RapidMiner Official Documentation, "Text Processing Extension Guide", ]10[ ...
https://docs.rapidminer.com/latest/studio/text-processing/, Accessed: April 2025 ...

نمایش کامل مراجع