انتخاب ویژگی در دسته بندی اتوماتیک مستندات و متون فارسی

محمد اخلاصی; علی شکوهی رستمی

انتخاب ویژگی در دسته بندی اتوماتیک مستندات و متون فارسی

محل انتشار: همایش جامع بین المللی کامپیوتر، فناوری اطلاعات و مهندسی برق

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 413

فایل این مقاله در 9 صفحه با فرمت PDF و WORD قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/773342

شناسه ملی سند علمی:

ITCOMI01_007

تاریخ نمایه سازی: 24 شهریور 1397

چکیده مقاله:

امروزه اطلاعات زیادی در قالب متون الکترونیکی و پایگاه های داده ای متنی ذخیره شده اند. برای استخراج دانش از این حجم بالای اطلاعات متنی، نیازمند استفاده از روش های خوشه بندی و طبقه بندی مستندات متنی هستیم . در اکثر روش های طبقه بندی متن معمولا براساس فراوانی کلمات و در نظر گرفتن متن به صورت مجموعه ای از کلمات، طبقه بندی انجام می شود ولی چنین نمایشی باعث ابعاد بالای متون، تعداد بسیار زیاد ویژگی ها و منجر به کاهش کارایی الگوریتم های طبقه بندی می گردد. در این پروژه به منظور کاهش تعداد ویژگی ها و انتخاب ویژگی های اصلی متن، از دانش پس زمینه و تکنیک های یادگیری ماشین استفاده شده است. در واقع با استفاده از هستان شناس وردنت و دانش پس زمینه ویژگی های اصلی متون انتخاب می شوند و با استفاده از الگویتم های یادگیری ماشین متون طبقه بندی می شوند. نتایج شبیه سازی روش پیشنهادی، نشان می دهد بهبود موثری در کاهش ابعاد متن و در نتیجه افزایش کارایی طبقه بندی متن ایجاد شده است.

کلیدواژه ها:

دسته بندی ، مستندات ، متون فارسی ، انتخاب ویژگی

نویسندگان

محمد اخلاصی

دانشجوی کارشناسی ارشد، رشته مهندسی کامپیوتر، نرم افزار موسسه آموزش عالی هدف

علی شکوهی رستمی

دانشجوی دکتری دانشگاه سیستان و بلوچستان