خصوصی سازی روش استخراج کلمات کلیدی در متون فارسی

  • سال انتشار: 1389
  • محل انتشار: اولین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات
  • کد COI اختصاصی: NCSCIT01_015
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1875
دانلود فایل این مقاله

نویسندگان

سید محمد حسینی خوزانی

گروه کامپیوتر - دانشگاه آزاد اسلامی واحد تفرش

طیبه جمالی

گروه کامپیوتر - دانشگاه پیام نور واحد گلپایگان

چکیده

هر چه حجم داده ها بیشتر و روابط میان آنها ÷یچیده تر باشد, دسترسی به اطلاعات نهفته در میان داده ها مشکلتر می شود و نقش روش های کشف و تحلیل داده ها از اسناد مختلف روشن تر می شود.یکی از این روش ها , راهکار بسیار موثر استخراج کلمات کلیدی است که بیانگر مضمون و محتوای اصلی متن است. در این مقاله راهکاری جدید ارائه شده است . که هدف آن , استخراج کلمات کلیدی با درنظر گرفتن کلمات ترکیبی کلیدی و همچنین استخراج جملات کلیدی موجود در مستندات فارس , به منظور طبقه بندی کارآمد انها می باشد.براساس بررسی های انجام گرفته بر روی چندین سند فارسی و مقایسه نتایج بدست آمده با روش های دیگر این روش میتواند کلمات کلیدی موجود ر متون را با دقت و سرعت بیشتری استخراج نماید به گونه ای که این کلمات کلیدی , بیانگر مضمون اصلی متن می باشند.

کلیدواژه ها

اسناد فارسی طبقه بندی , عملیات استخراج , کلمات کلیدی , محتوا

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.