الگوریتم جدیدی برای بهبود شناسایی وزن عروضی اشعار فارسی

سال انتشار: 1393
محل انتشار: دومین کنفرانس دستاوردهای نوین در مهندسی برق و کامپیوتر
کد COI اختصاصی: NAEC02_125
زبان مقاله: فارسی
تعداد مشاهده: 1295

نویسندگان

دانشجوی کارشناسی ارشد گروه کامپیوتر دانشکده فنی مهندسی دانشگاه قم

استادیار دانشکده کامپیوتر دانشگاه علم و صنعت ایران تهران

چکیده

در ادبیات فارسی یکی از زمینه های پرچالش شناسایی وزن اشعار است که در پزوهش های پیشین الگوریتمی برای تشخیص آن با استفاده از روش های داده کاوی ارائه شده است در این مقاله با استفاده از تغییر معیار شباهت به بهبود روش پرداخته شد. در ابتدا تاریخچه ای از کار انجام شده و مراحل آن بیان و سپس معیار شباهت جدید معرفی شد. برای آزمون برنامه از مجموعه اشعاری شامل 1297 بیت استفاده گشت که نیاز به 5 مرحله عملیات شامل حرکت گذاری تبدیل به رشته صامت و مصوت اعمال اختیارات شاعری، تبدیل به رشته Udash و در آخر تشخیص وزن داشت. برای تشخیص، رشته Udash به دست آمده را با الگوی 31 وزن معروف با ضریب شباهت Sørensen–Dice مقایسه و نتایج را با پژوهش پیشین مقایسه گردید. نتایج صحت را همانند پژوهش پیشین و در حدود 65 درصد نشان دادند ولی پیچیدگی الگوریتم جدید و همچنین زمان اجرای حدود 3 ثانیه بهبود پیدا کرد.

کلیدواژه ها

وزن اشعار فارسی، متن کاوی، انطباق رشته، معیار شباهت رشته، Levenshtein Sørensen–Dice coefficient

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.