روش های یادگیری ماشین در بررسی ویژگی های زبان شعری در اشعار شاعران دفاع مقدس (مطالعه موردی: اشعار دو شاعر دفاع مقدس؛ قیصر امین پور و محمدرضا عبدالملکیان)

  • سال انتشار: 1397
  • محل انتشار: فصلنامه مطالعات دفاع مقدس، دوره: 4، شماره: 3
  • کد COI اختصاصی: JR_HDSJ-4-3_006
  • زبان مقاله: فارسی
  • تعداد مشاهده: 406
دانلود فایل این مقاله

نویسندگان

کامیار جوانمردی

دانشگاه صنعتی شریف، تهران، ایران

منوچهر اکبری

استاد تمام زبان و ادبیات فارسی دانشگاه تهران

چکیده

شناسایی سبک نویسنده و پردازش زبان طبیعی از اهمیت ویژ ه ای برخوردار است و پژوهش در این زمینه به دو صورت کیفی و کمی انجام می شود. ازآنجایی که شعر و ادبیات همواره یکی از افتخارات تاریخی زبان فارسی به شمار می آید، شناسایی سبک نویسندگان و شاعران به صورت گسترده، بدون اعمال نظرات انسانی و به شیوه کمی، امری ضروری است. در این پژوهش کاربرد روش های آماری برای شناسایی سبک نویسنده مورد بررسی قرار می گیرد؛ به همین دلیل، ویژگی های واژگانی، حرفی و نحوی از متن های منتخب استخراج می شود. هدف اصلی مقاله، استخراج ویژگی های صوری متن و دسته بندی اشعار مربوط به دو شاعر حوزه دفاع مقدس (قیصر امین پور و محمدرضا عبدالملکیان) است. به این منظور، از دو دسته بند K نزدیک ترین همسایه و بیز ساده جهت انجام عمل دسته بندی و انتساب داده ها استفاده شد. بررسی هر کدام از دسته بندها با استفاده از معیارهای ارزیابی، انجام شد. نتایج ارزیابی ها روی سه نوع ویژگی نشان داد، ویژگی های واژگانی بدون حذف واژه های دستوری در دسته بند بیز ساده با ۹۲ درصد معیار F از بالاترین دقت در میان انواع ویژگی ها برخوردار است. این نتیجه، نشان دهنده کارآیی قابل ملاحظه این نوع ویژگی در شناسایی سبک نویسنده است.

کلیدواژه ها

شناسایی نویسنده, پردازش متن, سبک شناسی, دسته بندی خودکار متن, شعر دفاع مقدس

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.