بررسی روش های LDA و LSA و PLSA در متن کاوی

  • سال انتشار: 1395
  • محل انتشار: چهارمین کنفرانس بین المللی مهندسی برق و کامپیوتر
  • کد COI اختصاصی: COMCONF04_047
  • زبان مقاله: فارسی
  • تعداد مشاهده: 2296
دانلود فایل این مقاله

نویسندگان

مهدی نظری

گروه کامپیوتر، دانشکده فنی و مهندسی، واحد کرمانشاه، دانشگاه آزاد اسلامی، کرمانشاه، ایران

مریم حبیبی

عضو هیات علمی دانشگاه آزاد اسلامی واحد کرمانشاه، کرمانشاه، ایران

چکیده

امروزه اسناد و مقالات حجم عظیمی از اطلاعات در اینترنت را تشکیل می دهند. می توان گفت استفاده و بهره مندی کامل از تمام این اطلاعات تقریبا غیر ممکن می باشد. متن کاوی روشی برای استخراج اطلاعاتی است که به صورتغیر ساخت یافته نامرتب و نیمه ساخت یافته از این حجم اطلاعات می باشد. تشخیص طبقه، رده یا موضوع یک متن ناشناخته و تخصیص آن به دسته ی تشخیص داده شده را دسته بندی متون می گویند. دست بندی متون یکی ازنمودهای داده کاوی متون می باشد. بحث های زیادی در ارتباط با سازماندهی متون و بایگانی برای مقاصد شخصی، سازمانی، یا ساختارهای حقوقی مبتنی بر متن از طریق تکنیکهای دسته بندی متون انجام شده است. ما در این مقاله می خواهیم متن کاوی را بررسی کنیم و همچنین به بررسی روش هایی که کار کاوش متن را به صورت سریعتری انجام می دهند می پردازیم و که این روش های متن کاوی با توابع ریاضی کار کاوش متن را انجام می دهند

کلیدواژه ها

متن کاوی، دسته بندی متن، LDA ، LSA ، PLSA

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.