یادگیری فعال با اسناد برچسب دار و بدون برچسب در دسته بندی متون

  • سال انتشار: 1381
  • محل انتشار: هشتمین کنفرانس سالانه انجمن کامپیوتر ایران
  • کد COI اختصاصی: ACCSI08_018
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1552
دانلود فایل این مقاله

نویسندگان

سعید جلیلی

دانشگاه تربیت مدرس _ گروه مهندسی کامپیوتر

پریسا کردجمشیدی

دانشگاه تربیت مدرس _ گروه مهندسی کامپیوتر

چکیده

در بسیاری از مسائل یادگیری واقعی ، بدست آوردن نمونه های برچسب دار در مرحله آموزش بسیار پرهزینه می باشد. در این مقاله روشی برای دسته بندی متون پیشنهاد شده است که در آن ابتدا یک دسته بند بیزین ساده اولیه با تعداد کمی نمونه برچسب دار ساخته می شود، سپس با استفاده از یادگیری فعال و بکارگیری روش نمونه گیری بر اساس عدم اطمینان ب ه همراه ایده جدید مشابهت و انتخاب گروهی نمونه ها ، به صورت هدفمند نمونه های مفید را برای برچسب گذاری به کاربر می دهد تا در آموزش دسته بند از آنها استفاده کند . بدین ترتیب تعداد نمونه های برچسب دار مورد نیاز تا حد زیادی کاهش پیدا می انبوه نمونه های بدون برچسب به دسته بند EM کند. سپس با استفاده از روش داده می شوند تا به صورت خودکار برچسب گذاری شده و آموزش مجددا با مجموعه نمونه های برچسب دار و بدون برچسب صورت گیرد. در نهایت از دسته بر Boosting بند بیزین ساده ساخته شده به عنوان یک مبنا برای تشکیل کمیته اساس بیزین ساده استفاده می شود و دسته بندی نهایی با استفاده از کمیته مذکور و ترکیب آراء آنها صورت می گیرد.

کلیدواژه ها

بیزین ساده ، یادگیری فعال ، اسناد بدون برچسب ، EM ، نمونه گیری انتخابیBoosting

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.