سال انتشار: 1395
محل انتشار: کنفرانس بین المللی مهندسی و علوم کامپیوتر
کد COI مقاله: ICCSE01_239
زبان مقاله: فارسیمشاهد این مقاله: 132
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
با استفاده از پرداخت اینترنتی بسیار سریع و ساده می توانید اصل این مقاله را که دارای 7 صفحه است به صورت فایل PDF در اختیار داشته باشید.
آدرس ایمیل خود را در کادر زیر وارد نمایید:
مشخصات نویسندگان مقاله ارایه یک مدل پیشنهادی جهت استخراج ویژگی از نوشتارهای کلان
چکیده مقاله:
در فرآیند طبقه بندی متون (Text Classification)، یک مشکل عمومی وجود دارد، که آن هم تعداد زیاد ویژگی های (Features) مسیله است. به خاطر مدل های مختلف مانند کوله ای از کلمات (Bag Of Words)، هر کلمه به یک بعد نگاشت می شود و به دلیل تعدد زیاد کلمات یکتا در یک انباره ی متنی، حجم مدل، بسیار بزرگ می شود. برای مقابله با این مشکل یک روش عمومی به نام انتخاب ویژگی (Feature Selection) وجود دارد. در روش های انتخاب ویژگی، یک زیر مجموعه ای از کلمات موجود، به عنوان کلمات ارزشمند در طبقه بندی، شناسایی می شوند و بقیه ی کلمات، که ارزش زیادی در طبقه بندی ندارند (و در اصلاح اطلاعات زیادی ندارد)، بایستی حذف شده و در فرآیند طبقه بندی استفاده نشوند. در این مقاله سعی شده، روش ها و متدولوژی های مختلف انتخاب ویژگی بررسی شوند، و یک روش پیشنهادی جهت استخراج ویژگی از متون خبری کلان، ارایه شود.
کلیدواژه ها:
طبقه بندي متن، انتخاب ويژگي، استخراج ويژگي، كاهش ابعاد
کد مقاله/لینک ثابت به این مقاله
برای لینک دهی به این مقاله می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است و به عنوان سند ثبت مقاله در مرجع سیویلیکا مورد استفاده قرار میگیرد:https://civilica.com/doc/648391/
نحوه استناد به مقاله:
در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:کاویانی، مسعود و ندیمی، محمد،1395،ارایه یک مدل پیشنهادی جهت استخراج ویژگی از نوشتارهای کلان،کنفرانس بین المللی مهندسی و علوم کامپیوتر،نجف آباد،،،https://civilica.com/doc/648391
در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (1395، کاویانی، مسعود؛ محمد ندیمی)
برای بار دوم به بعد: (1395، کاویانی؛ ندیمی)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.
مدیریت اطلاعات پژوهشی
اطلاعات استنادی این مقاله را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.
علم سنجی و رتبه بندی مقاله
مشخصات مرکز تولید کننده این مقاله به صورت زیر است:
در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.
مقالات پیشنهادی مرتبط
- بهبود دسته بندی متون فارسی با ترکیب روش دو مرحله ای انتخاب ویژگی و الگوریتم های یادگیری ماشین
- ارائه یک روش جدید برای بهبود دسته بندی داده های متنی چندبرچسبی بااستفاده ازخوشه بندی فازی
- طبقه بندی صفحات وب مبتنی بر آنتولوژی
- بررسی و مقایسه خوشه بندی طیفی با خوشه بندی K-Means
- روشی جدید برای خوشه بندی مستندات متنی فارسی براساس آنتولوژی
مقالات فوق بر اساس داده کاوی مقالات مطالعه شده توسط پژوهشگران محاسبه شده است.
مقالات مرتبط جدید
- مطالعه و بهبود پایداری ولتاژ با جایابی بهینه STATCOM در سیستم قدرت
- عنوان تخمین زاویه ورود تعداد نامعلوم سیگنال همدوس با استفاده از قطری سازی آماره گشتاور مرتبه چهارم
- مروری بر پیام های AIS تجاری، بررسی یک پیام به صورت کاربردی
- مروری بر روش های مدیریت دانش به منظور افزایش بهره وری تیمی در توسعه نرم افزار چابک
- پیاده سازی ارزیابی عملکردی و امنیتی فایروال های نسل چهارم
مقالات فوق اخیرا در حوزه مرتبط با این مقاله به سیویلیکا افزوده شده اند.
به اشتراک گذاری این صفحه
اطلاعات بیشتر درباره COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.