یک روش جدید برای استخراج کلمات و عبارات کلیدی تک سنده فارسی با استفاده از تعیین حدود جمله
- سال انتشار: 1387
- محل انتشار: دومین کنگره مشترک سیستمهای فازی و هوشمند ایران
- کد COI اختصاصی: FJCFIS02_336
- زبان مقاله: فارسی
- تعداد مشاهده: 1053
نویسندگان
دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران تهران
چکیده
در این مقاله، از یک روش جدید برای استخراج واژههای کلیدی سند فارسی استفاده شده است. ویژگیهای آماری برای واژههای مختلف محاسبه شده و با استفاده از اعمال قواعد، واژههای کلیدی محتمل، انتخاب میشوند. گام بعدی محاسبه رخداد همزمان (co-occurrence)پیشین و پسین واژههای کلیدی محتمل، با واژههای تکرار شونده در جملات سند است. با استفاده از این روش بر خلاف اکثر روشهای آماری که فقط واژههای کلیدی یک واژهای را استخراج میکنند، واژههای کلیدی بیش از یک واژهای نیز استخراج میشوند. استفاده از روش رخداد همزمان بهبود خوبی را نشان میدهد و واژههای کلیدی بامعنی پیشنهاد میکند. عمل حذف واژههایعمومیstopwords) که به عنوان پیشپردازش روی اسناد انجام میشد در این روش بصورت پسپردازش انجام شده که واژههای کلیدیچتد واژهای نیز بدست آیندکلیدواژه ها
استخراج کلمات کلیدی، تعیین حدود جمله، رخداد همزمان، کلمات چند بخشیمقالات مرتبط جدید
- سودآوری مشتریان در خردهفروشی قطعات یدکی ماشین آلات راهسازی با رویکرد یادگیری ماشین
- ارائه روشی کارآمد جهت شناسایی کودکان نیازمند به پیوند مغز استخوان با استفاده از ترکیب طبقه بند ماشین بردار پشتیبان و الگوریتم بهینه سازی فاخته
- استخراج بهینه پارامترهای تاثیر گذار الگوریتم بهینه سازی بوفالوی آفریقایی با هدف استخراج ویژگی های مهم به منظور افزایش کارایی طبقه بندی داده ها
- ارائه روشی کارآمد برای بهبود عملکرد الگوریتم بهینه سازی کلاغ سیاه به منظور افزایش صحت خوشه بندی داده ها
- استفاده از الگوریتم باور بیزین در لایه کاملا متصل شبکه عصبی کانولوشن با هدف افزایش دقت تشخیص تصاویر
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.