ایجاد یک طبقه بند خودکار متون زبان فارسی به منظور استفاده در کتابخانه های دیجیتال شهر الکترونیک
محل انتشار: همایش ملی شهر الکترونیک
سال انتشار: 1390
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,730
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IAUHNCEC01_063
تاریخ نمایه سازی: 18 تیر 1391
چکیده مقاله:
دسته بندی یا طبقه بندی متون، برچسب زدن متون زبان طبیعی با توجه به طبقه بندی های موضوعی حاصل از مجموعه های از قبل مشخص شده می باشد. دسته بندی خودکار متون و انتساب اسناد به دسته های از پیش تعیین شده، در ده سال اخیر توجهات زیادی را به سوی خود جلب کرده است. این مسأله به خاطر رشد سریع متون الکترونیکی و مسأله نیاز به دسترسی اسناد، مدارک و مقالات علمی، صفحات وب، نامه های الکترونیکی و کتابخانه های دیجیتال بوده است. در این تحقیق برای پیاده سازی دسته بند خودکار برای متون فارسی، از الگوریتم K-NN که از روشهای یادگیری با ناظر است به منظور دسته بندی متون و اسناد شهر الکترونیک استفاده شده است. به منظور ارزیابی نتایج حاصل از دسته بندی، مجموعه اسناد فارسی پیکره همشهری به عنوان مجموعه های آموزشی و آزمایشی بکار رفته است. نتایج آزمایشات که با استفاده از توابع مشابهت مختلف به دست آمده است، نشان از دقت بسیار بالای روش دارد.
کلیدواژه ها:
نویسندگان
سامان باشباغی
دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه بوعلی سینا
مصطفی پرچمی
دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه بوعلی سینا
حسن ختنلو
استادیار دانشگاه، عضو هیئت علمی دانشگاه بوعلی سینا
حسن بشیری
عضو هیئت علمی دانشگاه صنعتی همدان
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :