به کارگیری روش متن کاوی به منظور دسته بندی سلسله مراتبی متون با رویکرد یادگیری عمیق درداده های حجیم

  • سال انتشار: 1397
  • محل انتشار: دومین کنگره ملی توسعه پژوهش های نوین در مهندسی برق کامپیوتر
  • کد COI اختصاصی: ECCIRD02_014
  • زبان مقاله: فارسی
  • تعداد مشاهده: 667
دانلود فایل این مقاله

نویسندگان

بهناز اسلامی

گروه مهندسی کامپیوتر، دانشکده برق و کامپیوتر، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران

مهدی حبیب زاده مطلق

استادیار گروه کامپیوتر، دانشگاه ایوانکی، سمنان، ایران

مجید فولادیان

استادیار گروه برق و الکترونیک، دانشگاه آزاد اسلامی واحد ساوه، ساوه، ایران

زهرا رضایی

گروه مهندسی کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه کاشان، اصفهان، ایران

چکیده

همواره تجزیه وتحلیل متن یک روش برای استخراج دانش از متن است که جهت بازیابی دانش نهان در متون، محدودیت حافظه و زمان در پردازش داده های بزرگ به دلیل منابع داده توزیع شده در وب، موتورهای جستجو و شبکه های اجتماعی حائز اهمیت می باشد. با بهبودداده ها در اینترنت و شبکه های اجتماعی، روش های قوی تر موردنیاز است که می تواند اطلاعات را از نزدیک و بلافاصله دسته بندی کند. از طریقانتزاع درداده های متنی، یادگیری عمیق می تواند با این چالش ها مقابله کند . در این مقاله روش یادگیری عمیق جهت دسته بندی به صورتسلسله مراتبی موردبررسی قرار می گیرد و نتایج نشان می دهند که این روش می تواند متون شبکه های اجتماعی و وب سایت ها را با دقت98.81 ٪ دسته بندی کند. این مقاله همچنین نشان می دهد که این شبکه پیچیده می تواند در سطح کلمه بهتر کار کند و نیازی به دانستن ساختارنحوی و معنایی زبان ندارد. نوآوری روش پیشنهادی، اضافه کردن یک سطح به ساختار سلسله مراتبی برای تشخیص عمومی و تشخیص دقیق ترکلاس است.

کلیدواژه ها

پردازش زبان طبیعی، داد ههای حجیم، دسته بندی، متن کاوی، یادگیری عمیق

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.