روشی جدید در انتخاب ویژگی برای دسته بندی مستندات متنی
- سال انتشار: 1392
- محل انتشار: اولین همایش منطقه ای بهینه سازی و روش های محاسبه نرم در مهندسی برق و کامپیوتر
- کد COI اختصاصی: ELECOM01_102
- زبان مقاله: فارسی
- تعداد مشاهده: 962
نویسندگان
دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر
استادیار و عضو هیئت علمی، دانشگاه آزاد اسلامی واحد تهران مرکزی گروه کامپیوتر
استادیار و عضو هیئت علمی، دانشگاه آزاد اسلامی واحد تهران مرکزی گروه کامپیوتر
چکیده
امروزه اطلاعات زیادی در قالب متون الکترونیکی و پایگاه های داده ای متنی ذخیره شده اند. برای استخراج دانش از این حجم بالای اطلاعات متنی، نیازمند استفاده از روش های خوشه بندی و طبقه بندی مستندات متنی هستیم. در اکثر روشهای طبقه بندی متن معمولا براساس فراوانی کلمات و در نظر گرفتن متن به صورت مجموعه ای از کلمات، طبقه بندی انجام می شود ولی چنین نمایشی باعث ابعاد بالای متون، تعداد بسیار زیاد ویژگی ها و منجر به کاهش کارایی الگوریتم های طبقه بندی می گردد. در این مقاله به منظور کاهش تعداد ویژگی ها و انتخاب ویژگی های اصلی متن، از دانش پس زمینه و تکنیکهای یادگیری ماشین استفاده شده است. در واقع با استفاده از هستان شناس وردنت و دانش پس زمینه ویژگی های اصلی متون انتخاب می شوند و با استفاده از الگویتم های یادگیری ماشین متون طبقه بندی می شوند. نتایج شبیه سازی روش پیشنهادی، نشان می دهد بهبود موثری در کاهش ابعاد متن و در نتیجه افزایش کارایی طبقه بندی متن ایجاد شده است.کلیدواژه ها
انتخاب ویژگی، طبقه بندی متن، هستان شناسی، یادگیری ماشینمقالات مرتبط جدید
- یک رویکرد مبتنی بر پردازش زبان طبیعی و مدلهای یادگیری ماشین برای ارزیابی خودکار تکالیف نوشتاری دانش آموزان و ارائه بازخورد به معلمان
- ادغام یادگیری عمیق بیزی برای تشخیص و ارزیابی کیفیت سگمنتیشن سرطان با مدیریت عدم قطعیت
- Comparative Analysis of Automation Ecosystems and Playbooks in Check Point, Palo Alto, Fortinet, and Cisco Firewalls
- چارچوب یکپارچه برای بهینه سازی کارایی و تقویت امنیت سیستم های توزیع شده در محیط های ابری، IoT و Edge
- Uncovering Genetic and Signaling Pathway Alterations in Pompe Disease through Bioinformatics Approaches
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.