ایجاد یک طبقه بند خودکار متون زبان فارسی به منظور استفاده در کتابخانه های دیجیتال شهر الکترونیک
- سال انتشار: 1390
- محل انتشار: همایش ملی شهر الکترونیک
- کد COI اختصاصی: IAUHNCEC01_063
- زبان مقاله: فارسی
- تعداد مشاهده: 1812
نویسندگان
دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه بوعلی سینا
دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه بوعلی سینا
استادیار دانشگاه، عضو هیئت علمی دانشگاه بوعلی سینا
عضو هیئت علمی دانشگاه صنعتی همدان
چکیده
دسته بندی یا طبقه بندی متون، برچسب زدن متون زبان طبیعی با توجه به طبقه بندی های موضوعی حاصل از مجموعه های از قبل مشخص شده می باشد. دسته بندی خودکار متون و انتساب اسناد به دسته های از پیش تعیین شده، در ده سال اخیر توجهات زیادی را به سوی خود جلب کرده است. این مسأله به خاطر رشد سریع متون الکترونیکی و مسأله نیاز به دسترسی اسناد، مدارک و مقالات علمی، صفحات وب، نامه های الکترونیکی و کتابخانه های دیجیتال بوده است. در این تحقیق برای پیاده سازی دسته بند خودکار برای متون فارسی، از الگوریتم K-NN که از روشهای یادگیری با ناظر است به منظور دسته بندی متون و اسناد شهر الکترونیک استفاده شده است. به منظور ارزیابی نتایج حاصل از دسته بندی، مجموعه اسناد فارسی پیکره همشهری به عنوان مجموعه های آموزشی و آزمایشی بکار رفته است. نتایج آزمایشات که با استفاده از توابع مشابهت مختلف به دست آمده است، نشان از دقت بسیار بالای روش دارد.کلیدواژه ها
دسته بندی متن، شاخص گذاری متن، شهر الکترونیک و الگوریتم K نزدیکترین همسایهمقالات مرتبط جدید
- طبقه بندی صفحات وب برای بهینه سازی موتورهای جستجو با استفاده از مدل ترکیبی یادگیری عمیق
- تحول دیجیتال با قراردادهای هوشمند بر پایه فناوری بلاکچین
- تحلیل و شناسایی آسیبپذیریهای ناش ی از حملات شرایط رقابتی در برنامه های وب مدرن
- مروری بر الگوریتم بهینه سازی ازدحام ذرات و کاربردها
- بهینه سازی زمانبندی و ذخیره سازی نتایج وظایف در محیطهای مه-ابر با یادگیری تقویتی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.