شناسایی ماکزیمم کلمات پرتکرار برای زبان های گوناگون

بهاره هاشم زاده; مجید عبدالرزاق نژاد; سیدمحمد جوادی مقدم

شناسایی ماکزیمم کلمات پرتکرار برای زبان های گوناگون

محل انتشار: چهارمین کنفرانس ملی فناوری اطلاعات، کامپیوتر و مخابرات

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 566

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/669024

شناسه ملی سند علمی:

ITCT04_301

تاریخ نمایه سازی: 17 آبان 1396

چکیده مقاله:

یکی از چالشهای موجود بر سر راه شناسایی کلمات پرتکرار، وجود زبانهای بسیار متنوع برای اطلاعات متنی و وابستگی روش های موجود شناسایی کلمات پرتکرار به نوع زبان و ساختار کلامی آن زبان خاص می باشد. لذا هدف این پژوهش، طراحی الگوریتمی مستقل از زبان بهمنظور شناسایی کلمات پرتکرار میباشد. از این رو با تمرکز روی خاصیت تکرار کلمات در هر متن و نسبت تکرار آن در سایر متون این امر انجام شده ا ست و در نهایت ماکزیمم بیشترین تکرار به عنوان کلمه پرتکرار انتخاب میگردد. عملکرد الگوریتم پیشنهادی نیز تو سط معیار نرخ دقت ت ش خیص مورد ارزیابی قرار گرفته ا ست . لازم به ذکر ا ست که این الگوریتم با الگوریتم مبتنی بر گراف مقایسه گردیده ا ست، که نرخ دقت کلی الگوریتم پیشنهادی 82.2 %درصد بوده است

کلیدواژه ها:

شناسایی ، کلمات پرتکرار ، زبان ، ماکزیمم

نویسندگان

بهاره هاشم زاده

گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه تربت حیدریه

مجید عبدالرزاق نژاد

گروه کامپیوتردانشکده فنی و مهندسی دانشگاه بزرگمهرقاینات

سیدمحمد جوادی مقدم

گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه بزرگمهر قاینات