تعیین شاعر به کمک روش های یادگیری ماشین

  • سال انتشار: 1386
  • محل انتشار: سومین کنفرانس بین المللی فناوری اطلاعات و دانش
  • کد COI اختصاصی: ICIKT03_101
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1935
دانلود فایل این مقاله

نویسندگان

امیرشهاب شاهمیری

دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر، ت

محمدرضا مطش بروجردی

دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر، ت

چکیده

شناسایی شاعر یکی از گرایش های دانش شناسایی نویسنده است که از مسایل مهم در دسته بندی متن و پردازش زبان های طبیعی به شمار می رود . این نوشتار دست آورد پژوهشی با هدف تعیین هوشمند اشعار چهار شاعر بزرگ پارسی » حافظ، خیامی، فردوسی و مولوی « به کمک روش های یادگیری ماشین » درخت تصمیم و شبکه عصبی مصنوعی « است . برای سنجش کارایی شبکه، دقت تصمیم گیری و تعیین توسط انسان نیز آزموده و نتایج آنها با بازدهی روش های یادگیری ماشین مقایسه شده است . همچنین در هنگام استخراج ویژگی های گوناگون اشعار برای ارزیابی توسط ماشین، کوشش شده تا شیوۀ تفکر انسان برای تشخیص اشعار شاعران شبیه سازی گردد و بدین منظور، نزدیک به 50 ویژگی گوناگون از اشعار ایرانی استخراج شده و در سه دستۀ فیزیکی، مفهومی و آوایی دسته بندی شده است . در این پژوهش بهطور میانگین دقت تعیین شاعر به کمک درخت تصمیم تا %94 و با شبکۀ عصبی تا %95/9 درستی نیز رسیده، در حالی که دقت تشخیص انسان، در جامعۀ آماری مورد مطالعه، تنها %34/4 بوده است

کلیدواژه ها

تعیین شاعر، یادگیری ماشین، شبکه عصبی مصنوعی، متن کاوی، طبقه بندی متن، درخت تصمیم، حافظ، خیامی، فردوسی، مولوی بلخی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.