شناسایی و ردیابی موضوع در مقالات خبری با خوشه بندی تجمعی و ماشین بردار پشتیبان

  • سال انتشار: 1396
  • محل انتشار: کنفرانس ملی فناوری های نوین در مهندسی برق و کامپیوتر
  • کد COI اختصاصی: PCCO01_198
  • زبان مقاله: فارسی
  • تعداد مشاهده: 381
دانلود فایل این مقاله

نویسندگان

سینا دامی

استادیار گروه کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران

زهرا حسین آبادی

دانشجوی کارشناسی ارشد IT واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران

چکیده

در این مقاله روشی برای شناسایی و ردیابی موضوعات در مقالات متنی ارایه شده است. شناسایی و ردیابی موضوع به عنوان یکی از موضوعات جالب توجه و حایز اهمیت در پردازش زبان طبیعی و متن کاوی مطرح است. هدف از انجام این پژوهش، شناسایی و ردیابی موضوعات موردنظر در منابع مختلف اخبار است. برای این منظور، ابتدا از خوشهبندی تجمعی براساس معیار متوسط ارتباط برای محاسبه ی شباهت بین موضوعه ای اخبار و به دنبال آن شناسایی این موضوع ها بهره گرفته شده است. سپس، با استفاده از الگوریتم یادگیری ماشین بردار پشتیبان برای ردیابی موضوعات استفاده شد. نتایج تجربی نشان از عملکرد مناسب روش پیشنهادی در مقایسه با روش های پایه دارد

کلیدواژه ها

متن کاوی، شناسایی و ردیابی موضوع، خوشه بندی تجمعی، ماشین بردار پشتیبان

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.