استفاده ازشبکه ی بیزین ساده و الگوریتم paice برای ریشه یابی کلمات فارسی و بررسی کاربرد ریشه یابی کلمات درتعیین میزان مشابهت متون
- سال انتشار: 1392
- محل انتشار: بیست و یکمین کنفرانس مهندسی برق ایران
- کد COI اختصاصی: ICEE21_783
- زبان مقاله: فارسی
- تعداد مشاهده: 1834
نویسندگان
دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران
دانشگاه صنعتی خواجه نصیرالدین طوسی
چکیده
درریخت شناسی زبانی و بازیابی اطلاعات ریشه یابی کلمه کاهش دادن گونه های مختلف گرامری کلمه همانند فعل صفت اسم جمع و غیره به یک فرم یکتا به نام ریشه است امروزه ریشه یابی کلمه به عنوان یکی ازروشهای افزایش کارایی سیستم های بازیابی اطلاعات محسوب میشود یکی دیگر ازتکنولوژیهای مههم درحوزه مسائل پردازش زبان طبیعی محاسبه میزان مشابهت متون است مشابهت متون پارامتری است که درجه مشابهت متون مختلف را اندازه میگیرد دراین مقاله ابتدا با استفاده ازشبکه بیزین ساده تمام کلمات متن را به دو کلاس فعل و یا اسم تقسیم بندی می کنیم سپس با استفاده ازروشی جدید که مبتنی برالگوریتم ریشه یاب Paice/Husk برای کلمات انگلیسی است به ریشه یابی کلمات می پردازیم این روش یک روش مرحله ای است و ازیک جدول ازقوانین برای حذف وندها استفاده می کند و درهرمرحله تنها یک وند را حذف می کند درپایان نیز با بکارگیری شینگل ها و معیار فاصله ی COSINE به ارایه یک روش جددی درتعیین میزان ممشابهت متون می پردازیم و نتایج بدست آمده را با روش استفاده شده درسیستم SCAM و روش Jaccard مقایسه می کنیمکلیدواژه ها
دسته بندی کلمات، ریشه یابی، شینگل، فضای برداری، میزان مشابهتمقالات مرتبط جدید
- بهینه سازی مدیریت انرژی در ریزشبکه ها با استفاده از الگوریتم های هوش مصنوعی
- مبانی، کاربردها و چالشهای یادگیری مشارکتی و تحلیل تجربی و مقایسه ابزارهای یادگیری فدرالی در پیاده سازی مدلهای یادگیری ماشین
- راهکارهای مبتنی بر هوش مصنوعی برای بهره وری انرژی در تولید سیمان: یک بررسی جامع
- معماری اینترنت اشیا مبتنی بر هوش مصنوعی در مدیریت انرژی هوشمند
- سیستم های EMS/BMS در ساختمان های ZEB و نمونههای اجرا شده آن در سطح جهانی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.