مروری بر رده بندی خوکار متن

سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 114

نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JKS-9-32_007

تاریخ نمایه سازی: 9 اسفند 1401

چکیده مقاله:

منابع با سرعت بسیار زیادی در حال رشد و انتشار هستند و در این میان سهم منابع دیجیتال و وبی بسیار مشهود است. به منظور سازماندهی این منابع، تلاش هایی برای رده بندی خودکار صورت گرفته که غالبا از الگوریتم های آماری و یادگیری ماشینی استفاده می کنند. همچنین در برخی منابع، استفاده از رده بندی های کتابخانه ای نیز توصیه شده است. اصلی ترین چالشی که در این زمینه وجود دارد آن است که رده بندی، فرآیندی انتزاعی و نیازمند تفکر است و تکنیک های ماشینی و هوش مصنوعی هنوز نتوانسته اند به طور کامل جایگزین ذهن انسان شوند. در این مقاله ضمن بیان اهمیت رده بندی خودکار به مفاهیم یادگیری ماشینی و تکنیک ها و الگوریتم های پرکاربرد در خوشه بندی و رده بندی مانند کا- نزدیکترین همسایه، مدل بیز، شبکه های عصبی مصنوعی، یادگیری عمیق، و طبقه بندی های ترکیبی پرداخته شد. همچنین مراحل رده بندی خودکار صفحات وب و تکنیک های مورد استفاده در هر مرحله مورد اشاره قرار گرفت. رسیدن به درک روشن تری از موضوع رده بندی خودکار، امکان هم زبانی با متخصصان حوزه هوش مصنوعی و کامپیوتر را فراهم آورده و زمینه ساز پژوهش های میان رشته ای خواهد بود.

کلیدواژه ها:

رده بندی ، رده بندی خودکار متن ، یادگیری ماشین ، رده بندی صفحات وب ، رده بندی کتابخانه ای

نویسندگان

رضا دهخدایی

دانشجوی دکتری، گروه علم اطلاعات و دانش شناسی، گرایش مدیریت دانش، دانشگاه تربیت مدرس، تهران، ایران.

عاطفه شریف

استادیار، گروه علم اطلاعات و دانش شناسی ،دانشگاه تربیت مدرس، تهران، ایران