خصوصی سازی روش استخراج کلمات کلیدی در متون فارسی
- سال انتشار: 1389
- محل انتشار: اولین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات
- کد COI اختصاصی: NCSCIT01_015
- زبان مقاله: فارسی
- تعداد مشاهده: 1875
نویسندگان
گروه کامپیوتر - دانشگاه آزاد اسلامی واحد تفرش
گروه کامپیوتر - دانشگاه پیام نور واحد گلپایگان
چکیده
هر چه حجم داده ها بیشتر و روابط میان آنها ÷یچیده تر باشد, دسترسی به اطلاعات نهفته در میان داده ها مشکلتر می شود و نقش روش های کشف و تحلیل داده ها از اسناد مختلف روشن تر می شود.یکی از این روش ها , راهکار بسیار موثر استخراج کلمات کلیدی است که بیانگر مضمون و محتوای اصلی متن است. در این مقاله راهکاری جدید ارائه شده است . که هدف آن , استخراج کلمات کلیدی با درنظر گرفتن کلمات ترکیبی کلیدی و همچنین استخراج جملات کلیدی موجود در مستندات فارس , به منظور طبقه بندی کارآمد انها می باشد.براساس بررسی های انجام گرفته بر روی چندین سند فارسی و مقایسه نتایج بدست آمده با روش های دیگر این روش میتواند کلمات کلیدی موجود ر متون را با دقت و سرعت بیشتری استخراج نماید به گونه ای که این کلمات کلیدی , بیانگر مضمون اصلی متن می باشند.کلیدواژه ها
اسناد فارسی طبقه بندی , عملیات استخراج , کلمات کلیدی , محتوامقالات مرتبط جدید
- مرور سیستماتیک کاربرد هوش مصنوعی در موسیقی
- In-silico Analyses for Finding Potential Key Genes and Pathways Associated with Guillain-Barré Syndrome Using Computational Tools
- OCD Severity Based on EEG Signals
- Investigating the (non) -Impact of Customizing Knowledge Bases of Artificial Intelligence -Driven Robot on Language for Specific Purposes Learning
- The Need for Telehealth and Tele-Educationon in Optimizing Measles Surveillance and Reducing Healthcare Costs
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.