یک مدل بیشینه بی نظمی جهت رفع ابهام معنایی کلمات فارسی به کمک ویژگی های مدل سازی موضوع
- سال انتشار: 1389
- محل انتشار: شانزدهمین کنفرانس سالانه انجمن کامپیوتر ایران
- کد COI اختصاصی: CSICC16_074
- زبان مقاله: فارسی
- تعداد مشاهده: 1463
نویسندگان
گروه هوش مصنوعی،دانشگاه آزاد اسلامی،مشهد
گروه برق،دانشگاه آزاد اسلامی،مشهد
گروه زبان شناسی،دانشگاه فردوسی مشهد
چکیده
دراین مقاله مدلی برای رفع ابهام از کلمات مبهم و دارای معانی متعدد فارسی براساس روش دسته بندی بیشینه بی نظمی و استخراج ویژگیهای جدید پیشنهاد شده است برای ایجاد این مدل از دو دسته ویژگی استفاده شده است دسته اول ویژگیها کلمات و نشانه هایی است که همراه کلمه مبهم بکاربرده شده اند و دسته دوم ویژگیها با بکاربردن روشهای مدلسازی موضوع بدست می آید یک مدل موضوعی مدلی آماری برای استخراج چکیده موضوعات موجود در اسناد یک پیکره است درمقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله LDA برای این منظور استفاده کرده ایم رفع ابهام از هرکلمه مبهم بعنوان یک مساله دسته بندی جداگانه درنظر گرفته می شود نتایج آزمایشات برایچهارکلمه مبهم پرتکرار در زبان فارسی که از پیکره پژوهشکده پردازش هوشمند علائم استخراج شد دقت حدود 97.67% را نشان میدهد که بیانگر موثربودن این روش در یافتن معنی مناسب کلمات مبهم است.کلیدواژه ها
بیشینه بی نظمی،تخصیص پنهان دریکله،چند معنایی،دسته بندی،رفع ابهام معنایی،مدل سازی موضوعمقالات مرتبط جدید
- تحلیل انطباقی کیفیت و میزان محبوبیت خدمات ابری با بررسی و مقایسه رتبه بندی Tranco و رتبه بندی عملکردی شرکت های ابری
- طبقه بندی سیگنال های EEG ثبت شده از قشر پیش پیشانی به منظور کشف اثر موسیقی در شدت احساسات با استفاده از شبکه عصبی مصنوعی و پرسشنامه
- ارائه رویکردی برای مدیریت ریسک در پروژه های نرمافزاری با استفاده از خوشه بندی تجمعی
- تحلیل احتمالنقض ترتیب علیتی پیام ها در یک الگوریتم پخش علیتی در سیستمهای توزیع شده
- بهینه سازی به سبک گربه های شنی: الگوریتمی برای جستجوی کارآمد و مدیریت ازدحام
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.