دسته بندی اسناد الکترونیکی با استفاده از خوشه بندی
- سال انتشار: 1403
- محل انتشار: اولین همایش ملی علوم و فناوری های نوظهور و شالوده شکن در حوزه دفاعی
- کد COI اختصاصی: EDST01_100
- زبان مقاله: فارسی
- تعداد مشاهده: 212
نویسندگان
عضو هیئت علمی گروه مهندسی کامپیوتر، دانشگاه امام علی(ع)، تهران، ایران
دانشجوی کارشناسی ارشد رشته مهندسی برق، دانشگاه ترییت مدرس، تهران، ایران
چکیده
دسته بندی خودکار در دسترسی سریع و مطلوب به اسناد الکترونیکی، اهمیت ویژه ای دارد. روش های معمول در دسته بندی خودکار اسناد الکترونیکی، روش های یادگیری ماشین (هوش مصنوعی) هستند. اگر چه خوشه بندی اسناد، بیشتر در حوزه های متن کاوی و بازیابی اطلاعات کاربرد دارد، امروزه از روش های خوشه بندی، برای افزایش کارایی دسته بندهای متن استفاده می شود. در این مقاله، روشی برای دسته بندی اسناد با استفاده از خوشه بندی اسناد آموزشی براساس مشابهت یا عدم مشابهت کلاس های اسناد، پیشنهاد شده است. در این روش مجموعه اسناد آموزشی اولیه با یکی از روش های خوشه بندی (بر اساس مشابهت یا عدم مشابهت کلاس های اسناد آموزشی) به چند خوشه تقسیم می شود. از روی هر خوشه از اسناد، دسته بندی ساخته شده و با اسناد آزمون مربوط به همان خوشه، ارزیابی می شود. میکرومیانگین نتایج ارزیابی دسته بندهای ساخته شده از روی خوشه ها، نسبت به حالتی که فقط یک دسته بند از روی کل مجموعه آموزش ساخته می شود، حدود ۱۵ درصد افزایش کارایی را براساس معیارهای دقت و بازخوانی نشان می دهد.کلیدواژه ها
دسته بندی اسناد، خوشه بندی اسناد، Rocchio، بیزین ساده، SVMمقالات مرتبط جدید
- تحلیل چالشها و راهکارهای تقویت ارتباط دانشگاه و صنعت: با تمرکز بر حلقههای مفقوده
- بازخوانی نقش دانشگاه و صنعت در توسعه ملی: از موانع تا راهکارها
- نشانگر تشخیصی جدید در ژن C-myc به عنوان کیت غیر تهاجمی تشخیص سرطان دهان
- برنامه ریزی منابع تجدید پذیر با درنظر گرفتن برنامه ریزی توسعه انتقال و تولید منابع توان راکتیو
- برنامه ریزی همزمان توسعه انتقال و منابع تولید توان راکتیو با استفاده از یک الگوریتم تکاملی بهبود یافته
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.