ساخت یک نمایه ساز خودکار برای متون فارسی

  • سال انتشار: 1382
  • محل انتشار: یازدهمین کنفرانس مهندسی برق
  • کد COI اختصاصی: ICEE11_018
  • زبان مقاله: فارسی
  • تعداد مشاهده: 2011
دانلود فایل این مقاله

نویسندگان

مسعود تشکری

آزمایشگاه سیستمهای نرم افزاری دانشکده مهندسی کامپیوتر و فناوری اطل

محمدرضا میبدی

چکیده

در این مقاله یک نمایه ساز خودکار برای متون فارسی ساخته شده است. برای آزمایش این سیستم، 450 چکیده و 32 پرس وجوی فارسی، که در زمین ههای تخصصی کامپیوتر هستند، جمع آوری شده است. بر روی متون جمع آوری شده، ابتدا شیوه توزیع واژگان مطالعه م یشود. سپس فهرستی از واژگانی که در زبان فارسی، عمومی به شمار م یروند تهیه م یشود. در این مقاله با مطالعه روش ارزیابی سیستمهای بازیابی متن، سیستم نمایه ساز خودکار ارائه شده، با استفاده از دو پارامتر "بازخوانی" و "دقت" ارزیابی م یشود. همچنین با استفاده از ریشه یاب خودکار واژگان فارسی، تغییرات کیفی سیستم در هنگام استفاده از ریشه یابی واژگان نیز مورد بررسی قرار م یگیرد

کلیدواژه ها

نمایه سازی خودکار، واژگان عمومی زبان فارسی، بازیابی متون فارسی، ارزیابی نمایه ساز، ریشه یابی واژگان فارسی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.