دستهبندی اسناد متنی حجیم با استفاده از ترکیب درهمساز کمینه وkنزدیکترین همسایه پیشنهادی
- سال انتشار: 1391
- محل انتشار: دومین کنفرانس ملی مهندسی نرم افزار دانشگاه آزاد لاهیجان
- کد COI اختصاصی: LNCSE02_033
- زبان مقاله: فارسی
- تعداد مشاهده: 1502
نویسندگان
گروه مهندسی نرم افزار ، دانشگاه آزاد اسلامی واحد شبستر، ایران
استادیار دانشگاه علم و صنعت، تهران، ایران
چکیده
در دههی گذشته پیشرفتهای زیادی در زمینهی دستهبندی اسناد متنی انجام گرفته و الگوریتمهای زیادی در این زمینه پیشنهاد شده است. در این مقاله به دستهبندی اسناد متنی حجیم پرداخته شده است. روش پیشنهادی به کار بردن درهمساز کمینه 1 به همراه دستهبندk نزدیکترین همسایه 2 میباشد. تابع درهمساز کمینه معمولا برای سرعت بخشیدن در جستجوی جداول، فشردهسازی دادهها و تشخیص رکوردهای تکراری در حجم زیاد داده استفاده میشود [ 3]، اما در این مقاله برای خلاصه کردن اسناد متنی به کار گرفته شده است. استفاده از درهمساز کمینه به همراه یک دستهبند به صورت طبیعی با افت دقت همراهاست، اما در عین حال باعث بالا رفتن سرعت عملیات دستهبندی میشود. در این مقاله برای حل مشکل افت دقت حاصل از درهمساز کمینه، یک دستهبندk نزدیکترین همسایه پیشنهاد شده، که در آن به جای در نظر گرفتن شباهت کسینوسی بین اسناد از شباهت جاکارد استفاده شده است. این دستهبند بر روی 500 سند انتخابی از بین 2000 سند موجود در مجموعه داده انتقادات راجع بهفیلم 3، پیادهسازی شده که 400 سند برای آموزش و 100 سند برای آزمایش در نظر گرفته شده استکلیدواژه ها
دستهبندی اسناد متنی، درهمساز کمینهk نزدیکترین همسایه و تشابه جاکاردمقالات مرتبط جدید
- مرور سیستماتیک کاربرد هوش مصنوعی در موسیقی
- In-silico Analyses for Finding Potential Key Genes and Pathways Associated with Guillain-Barré Syndrome Using Computational Tools
- OCD Severity Based on EEG Signals
- Investigating the (non) -Impact of Customizing Knowledge Bases of Artificial Intelligence -Driven Robot on Language for Specific Purposes Learning
- The Need for Telehealth and Tele-Educationon in Optimizing Measles Surveillance and Reducing Healthcare Costs
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.