روشی جدید در انتخاب ویژگی برای دسته بندی مستندات متنی
- سال انتشار: 1392
- محل انتشار: اولین همایش منطقه ای بهینه سازی و روش های محاسبه نرم در مهندسی برق و کامپیوتر
- کد COI اختصاصی: ELECOM01_102
- زبان مقاله: فارسی
- تعداد مشاهده: 932
نویسندگان
دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر
استادیار و عضو هیئت علمی، دانشگاه آزاد اسلامی واحد تهران مرکزی گروه کامپیوتر
استادیار و عضو هیئت علمی، دانشگاه آزاد اسلامی واحد تهران مرکزی گروه کامپیوتر
چکیده
امروزه اطلاعات زیادی در قالب متون الکترونیکی و پایگاه های داده ای متنی ذخیره شده اند. برای استخراج دانش از این حجم بالای اطلاعات متنی، نیازمند استفاده از روش های خوشه بندی و طبقه بندی مستندات متنی هستیم. در اکثر روشهای طبقه بندی متن معمولا براساس فراوانی کلمات و در نظر گرفتن متن به صورت مجموعه ای از کلمات، طبقه بندی انجام می شود ولی چنین نمایشی باعث ابعاد بالای متون، تعداد بسیار زیاد ویژگی ها و منجر به کاهش کارایی الگوریتم های طبقه بندی می گردد. در این مقاله به منظور کاهش تعداد ویژگی ها و انتخاب ویژگی های اصلی متن، از دانش پس زمینه و تکنیکهای یادگیری ماشین استفاده شده است. در واقع با استفاده از هستان شناس وردنت و دانش پس زمینه ویژگی های اصلی متون انتخاب می شوند و با استفاده از الگویتم های یادگیری ماشین متون طبقه بندی می شوند. نتایج شبیه سازی روش پیشنهادی، نشان می دهد بهبود موثری در کاهش ابعاد متن و در نتیجه افزایش کارایی طبقه بندی متن ایجاد شده است.کلیدواژه ها
انتخاب ویژگی، طبقه بندی متن، هستان شناسی، یادگیری ماشینمقالات مرتبط جدید
- تحلیل انطباقی کیفیت و میزان محبوبیت خدمات ابری با بررسی و مقایسه رتبه بندی Tranco و رتبه بندی عملکردی شرکت های ابری
- طبقه بندی سیگنال های EEG ثبت شده از قشر پیش پیشانی به منظور کشف اثر موسیقی در شدت احساسات با استفاده از شبکه عصبی مصنوعی و پرسشنامه
- ارائه رویکردی برای مدیریت ریسک در پروژه های نرمافزاری با استفاده از خوشه بندی تجمعی
- تحلیل احتمالنقض ترتیب علیتی پیام ها در یک الگوریتم پخش علیتی در سیستمهای توزیع شده
- بهینه سازی به سبک گربه های شنی: الگوریتمی برای جستجوی کارآمد و مدیریت ازدحام
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.