کاوشی بر رفتار الگوریتم های کلاسه بندی مبتنی بر درخت تصمیم گیری و الگوریتم نزدیکترین K همسایه در متون فارسی
- سال انتشار: 1392
- محل انتشار: همایش مهندسی کامپیوتر و توسعه پایدار با محوریت شبکه های کامپیوتری، مدلسازی و امنیت سیستم ها
- کد COI اختصاصی: CESD01_235
- زبان مقاله: فارسی
- تعداد مشاهده: 1490
نویسندگان
دانشگاه آزاد اسلامی واحد علوم و تحقیقات گروه کامپیوتر، یزد، ایران
استادیار دانشگاه آزاد اسلامی واحد میبد، گروه کامپیوتر، میبد، ایران
چکیده
با توجه به اینکه سازمان دهی اطلاعات آنلاین در قالب دسته بندی مستندات زبان طبیعی در دسته هایی که قبلا بر اساس محتوایشان دستته بندی شده اند یکی از روش های مهم مدیریت اطلاعات محسوب می شوند و با توجه به اقداماتی که در این زمینه برای زبان های دیگر انجام گرفته است، نیاز به طبقه بندی متون فارسی و اهمیت آن به خوبی احساس می شود. روش ها و الگوریتم های متفاوتی برای دسته بندی متن بکار برده شده است، که این روش ها در دقت و محاسبات متفاوت می باشند با توجه به فعالیت های محدودی که در زمینه دسته بندی متون فارسی انجام شده است، در این مقاله به کاوشی بر روی دو روش کلاسه بندی مبتنی بر درخت تصمیم گیی طبقه بندی از نزدیکترین همسایه و مکانیزم عملکرد آنها برای کلاسه بندی اسناد موجود بر روی متون فارسی پرداخته می شود. طبق مطالعات انجام شده روش K تا همسایه نزدیک در عمل کارایی خوبی دارد. مشکل آن اینست که در طی دسته بندی محاسبات زیادی لازم است. الگوریتم های درخت های تصمیم گیری سریع و همچنین مقیاس پذیر هم در متغیرها و هم سایز مجموعه آموزش هستند. یکی از مشکلات درختسهای تصمیم گیری برای متن کاوی اینست که تنها به تعداد کمی از لغت ها وابسته است.کلیدواژه ها
کلاس بندی، درخت تصمیم گیری، k نزدیکترین همسایه، پیش پردازشمقالات مرتبط جدید
- مدلسازی و شبیه سازی جبران ساز سری سنکرون استاتیکی توزیع برای حل چالش های شبکه توزیع بر پایه الگوریتم بهینه سازی گرگ خاکستری
- تاثیر دما بر تنش زدایی فولاد در تمپرینگ عملیات حرارتی
- معماری ادراکی برای تعامل تیمی انسان و ربات
- شبیه سازی اثر تغییر بار بر خروجی مولد فشرده ساز شار دیسکی
- سیستم پرداخت الکترونیکی کارآمد برای تجارت الکترونیک
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.