دسته بندی هوشمند کتاب ها با استفاده از تحلیل محتوایی و کلیدواژه های ورودی
- سال انتشار: 1403
- محل انتشار: بیست و یکمین کنفرانس ملی مهندسی برق،کامپیوتر و مکانیک
- کد COI اختصاصی: ECME21_088
- زبان مقاله: فارسی
- تعداد مشاهده: 203
نویسندگان
۱- دانشجوی کارشناسی ارشد، دانشکده علوم پایه- دانشگاه تربیت مدرس - تهران
۲- استادیار - دکتری مهندسی کامپیوتر- دانشگاه شاهد – تهران
چکیده
در این مقاله، یک برنامه پردازشی و تحلیلی طراحی شده است که با استفاده از پایگاه داده و موتور جستجوی متن الاستیک سرچ، امکان تحلیل متون کتاب ها را فراهم می کند. با توجه به حجم بالای کتاب های الکترونیکی منتشر شده توسط ناشران مختلف و اهمیت موضوعات اجتماعی، اخلاقی و مذهبی در تغییرات فرهنگی و اجتماعی، نیاز به رصد دقیق کتاب ها و مقالات چاپ شده در این حوزه ها وجود دارد. یکی از چالش های اصلی، شناسایی سریع متون مرتبط با یک حوزه خاص است. تجربه نشان داده است که استفاده از نیروی انسانی به تنهایی نمی تواند این نیاز را برطرف کند؛ بنابراین، استفاده از کامپیوتر و روش های هوشمندسازی به فرد متخصص کمک می کند تا در زمان کوتاه تری منابع جدید را شناسایی کرده و آن ها را به تحلیل گران دیگر ارجاع دهد. بررسی دقیق و دسته بندی مجموعه ای از کتاب ها کاری بسیار دشوار و زمان بر است. در صورتی که نیاز به بررسی و دسته بندی سریع کتاب ها بر اساس موضوعات و محتوای آن ها باشد، این برنامه می تواند با دسته بندی هوشمند محتوای کتاب ها بر اساس موضوعات تعریف شده و استخراج کلمات کلیدی مهم، دید کلی و دقیقی از ارتباط میان کتاب ها به فرد متخصص ارائه دهد. همچنین، این برنامه قادر است یک داشبورد کلی از موضوعات دسته بندی شده کتاب ها را نمایش دهد، که کاربردهای زیادی را به همراه خواهد داشت.کلیدواژه ها
دسته بندی، کلمه کلیدی، پردازش متن، کتاب، تحلیل متن، یادگیری، زبان طبیعیاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.