راهکاری برای قطعه بندی بدون نظارت متن در زبان فارسی
- سال انتشار: 1391
- محل انتشار: همایش ملی علوم و مهندسی کامپیوتر
- کد COI اختصاصی: NCCSE01_115
- زبان مقاله: فارسی
- تعداد مشاهده: 1010
نویسندگان
دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر
عضو هیئت علمی دانشگاه آزاد اسلامی واحد ماهشهر
عضو هیئت علمی دانشگاه قم
چکیده
در این مقاله الگوریتمی برای پیدا کردن مرز بین موضوعات درون یک متن فارسی ارائه می شود که مبتنی بر انسجام کلمات و یک مدل گرافیکی با نام dotplot می باشد . سپس تغییراتی روی این الگوریتم اعمال کرده و میزان کارایی آن را افزایش داده و میانگین صحت را به مرز حدود 70 درصد می رسانیم .از طریق مشاهده نمودار و تفکیک دستی مرزهای موجود در نمودار می توان این الگوریتم را بصورت نیمه خودکار، و بااستفاده از فرمولی که در ادامه گفته می شود می توان این الگوریتم را تماماً خودکار اجرا نمود.کلیدواژه ها
قطعه بندی متن ، اسناد فارسی ، بازیابی اطلاعاتمقالات مرتبط جدید
- تحلیل انطباقی کیفیت و میزان محبوبیت خدمات ابری با بررسی و مقایسه رتبه بندی Tranco و رتبه بندی عملکردی شرکت های ابری
- طبقه بندی سیگنال های EEG ثبت شده از قشر پیش پیشانی به منظور کشف اثر موسیقی در شدت احساسات با استفاده از شبکه عصبی مصنوعی و پرسشنامه
- ارائه رویکردی برای مدیریت ریسک در پروژه های نرمافزاری با استفاده از خوشه بندی تجمعی
- تحلیل احتمالنقض ترتیب علیتی پیام ها در یک الگوریتم پخش علیتی در سیستمهای توزیع شده
- بهینه سازی به سبک گربه های شنی: الگوریتمی برای جستجوی کارآمد و مدیریت ازدحام
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.