به کارگیری روش متن کاوی به منظور دسته بندی سلسله مراتبی متون با رویکرد یادگیری عمیق درداده های حجیم
- سال انتشار: 1397
- محل انتشار: دومین کنگره ملی توسعه پژوهش های نوین در مهندسی برق کامپیوتر
- کد COI اختصاصی: ECCIRD02_014
- زبان مقاله: فارسی
- تعداد مشاهده: 667
نویسندگان
گروه مهندسی کامپیوتر، دانشکده برق و کامپیوتر، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
استادیار گروه کامپیوتر، دانشگاه ایوانکی، سمنان، ایران
استادیار گروه برق و الکترونیک، دانشگاه آزاد اسلامی واحد ساوه، ساوه، ایران
گروه مهندسی کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه کاشان، اصفهان، ایران
چکیده
همواره تجزیه وتحلیل متن یک روش برای استخراج دانش از متن است که جهت بازیابی دانش نهان در متون، محدودیت حافظه و زمان در پردازش داده های بزرگ به دلیل منابع داده توزیع شده در وب، موتورهای جستجو و شبکه های اجتماعی حائز اهمیت می باشد. با بهبودداده ها در اینترنت و شبکه های اجتماعی، روش های قوی تر موردنیاز است که می تواند اطلاعات را از نزدیک و بلافاصله دسته بندی کند. از طریقانتزاع درداده های متنی، یادگیری عمیق می تواند با این چالش ها مقابله کند . در این مقاله روش یادگیری عمیق جهت دسته بندی به صورتسلسله مراتبی موردبررسی قرار می گیرد و نتایج نشان می دهند که این روش می تواند متون شبکه های اجتماعی و وب سایت ها را با دقت98.81 ٪ دسته بندی کند. این مقاله همچنین نشان می دهد که این شبکه پیچیده می تواند در سطح کلمه بهتر کار کند و نیازی به دانستن ساختارنحوی و معنایی زبان ندارد. نوآوری روش پیشنهادی، اضافه کردن یک سطح به ساختار سلسله مراتبی برای تشخیص عمومی و تشخیص دقیق ترکلاس است.کلیدواژه ها
پردازش زبان طبیعی، داد ههای حجیم، دسته بندی، متن کاوی، یادگیری عمیقمقالات مرتبط جدید
- سیستم تشخیص نفوذ در محیط رایانش ابری با استفاده از یادگیری ویژ گی
- کاهش هزینه تعمیراتی ماشین های سنگین از طریق بهبود الگوریتم درخت تصمیم با الگوریتم های انتخاب ویژگی Information Gain ،Correlation و SVM
- پردازش کوانتومی تصاویر پزشکی و تشخیص لبه آن با استفاده از الگوریتم QHED
- بررسی و مقایسه روشهای تشخیص اکانت های جعلی در شبکه های اجتماعی
- مکان یابی و مقدار بهینه منابع تولید پراکنده به منظورکاهش تلفات و بهبود انحراف ولتاژ شبکه نامتعادل توزیع
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.