بررسی روش های و الگوریتم های دسته بندی اخبار با استفاده از پردازش زبان طبیعی (NLP)

  • سال انتشار: 1394
  • محل انتشار: دومین کنفرانس ملی توسعه علوم مهندسی
  • کد COI اختصاصی: AIHE09_204
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1685
دانلود فایل این مقاله

نویسندگان

اکبر بهرامپور

دانشجوی کارشناسی ارشد ،نرم افزار، موسسه آموزش عالی آیندگان،تنکابن

همایون بهشتی

عضو هیئت علمی، گروه کامپیوتر ، موسسه آموزش عالی آیندگان،تنکابن

طیبه لاکتراشی

دانشجوی کارشناسی ارشد ،نرم افزار، موسسه آموزش عالی آیندگان،تنکابن

چکیده

امروزه حجم بسیار زیاده داده و اطلاعات در وب، لزوم استفاده از سیستم های بازیابی کننده اطلاعات را بیش از پیش نمایان میسازد. در این میان حجم قابل توجهی از اطلاعات موجود در وب در حوزه اخبار می باشد، لذا سیستم هایی که به بازیابی اخبار ازاینترنت می پردازند به یکی از ابزارهای مهم در دنیای فناوری اطلاعات تبدیل شده اند. با توجه به حجم بسیار زیاد اخبار که بصورتروزانه تولید و در فضای اینترنت پخش می شود، دسته بندی موضوعی اخبار تبدیل به یکی از بزرگترین دغدغه ها شده است. درچند سال اخیر الگوریتم های زیادی برای مساله دسته بندی اسناد پیشنهاد شده است که اغلب کارهای انجام شده روی اسناد بهزبان انگلیسی بوده است. تعدادی از این الگوریتم ها برای دسته بندی متون فارسی بکار گرفته شده است. در این مقاله با مرور اینالگوریتم ها و بررسی نقاط قوت و ضعف آنها، به مقایسه و ارزیابی آنها پرداخته شده است.

کلیدواژه ها

پردازش زبان طبیعی دسته بندی موضوعی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.