طبقه بندی متن با استفاده از مدل های یادگیری ماشین

  • سال انتشار: 1403
  • محل انتشار: نوزدهمین کنفرانس ملی پژوهش های کاربردی در علوم برق ،کامپیوتر و مهندسی پزشکی
  • کد COI اختصاصی: ECMECONF19_052
  • زبان مقاله: فارسی
  • تعداد مشاهده: 151
دانلود فایل این مقاله

نویسندگان

سهیلا ابدام

کارشناسی ارشد هوش مصنوعی و رباتیکز

مریم ابدام

کارشناسی ارشد مدیریت آموزشی

چکیده

در تمام برنامه هایی که داده ها نقش مهمی دارند مانند دانشگاه ها، شرکت های تکنولوژی، موسسات تحقیقاتی و سازمان های دولتی، حفظ داده های نامنظم چالش بزرگی است. برای یک موجود (شیء، مکان)، بیشتر داده ها به صورت نامنظم هستند. تا به حال تحلیل داده یا کاوش متن بر ارتباطات موجود در یک مجموعه داده تمرکز داشته اند تا الگوهای مهمی که اطلاعات موجود در مجموعه داده را بازتاب می دهند، بدست آورند. این اطلاعات برای تصمیم گیری استفاده می شود. تحلیل متن به اعداد و تبدیل متن به اعداد به جهت کشف الگوها کمک می کند. اگر داده بیشتر سازمان یافته شود، تحلیل بهتری انجام خواهد شد و در نهایت تصمیمات بهتری گرفته خواهد شد. پردازش دستی هر بیت از داده ها و همچنین دسته بندی داده ها دشوار است و باعث ظهور ابزارهای هوش مصنوعی پردازش متن در حوزه پردازش زبان طبیعی شده تا الگوهای زبانی و واژگانی را تجزیه و تحلیل کنند. قبل از کاوش، بازبینی و آشنایی با ماهیت داده ها مهم است. با افزایش اندازه اطلاعات و نیاز به دقت و صحت، فرآیند خودکار برای دسته بندی متن لازم است. فرصت تحقیقات دیگر ایجاد مدل های پیچیده داده متنی با استفاده از سیستم های یادگیری عمیق است که توانایی انجام وظایف زبانی طبیعی پیچیده با نیازهای معنایی را دارند. تحلیل داده پایه دسته بندی متن است و می تواند به عنوان موتور کشف اطلاعات عمل کند. این نتایج می توانند برای برنامه های پدیدار که فرآیندهای تصمیم گیری را پشتیبانی می کنند، استفاده شوند. این تصمیم ها به انسان ها کمک می کنند تا منابع را بهبود دهند و بیشترین مزایا را ارائه دهند.

کلیدواژه ها

طبقه بندی متن، یادگیری ماشین، یادگیری عمیق

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.