تشخیص خودکار کنایه در جملات زبان فارسی با درخت تصمیم

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 870

فایل این مقاله در 15 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NSOECE05_013

تاریخ نمایه سازی: 10 تیر 1396

چکیده مقاله:

امروزه کنایه به یک ویژگی فراگیر در بسیاری از متون برخط تبدیل شده است. افراد برای بیان زیباتر منظور خود از کنایه استفاده می کنند. با اجتماعی تر شدن و تعاملی شدن فضای مجازی، مسیله تشخیص کنایه بیش تر از قبل مورد توجه قرار گرفته شده است چرا که تشخیص کنایه به تعیین قطبیت درست جملات در اندیشه کاوی کمک فراوانی می کند. تاکنون در مورد تشخیص کنایه در زبان فارسی انجام نشده است. فارسی زبانان به منظور بیان کنایه در نوشتار و گفتار خود از روش های مختلفی استفاده می کنند. یکی از پرکاربردترین روش های بیان کنایه در میان فارسی زبانان استفاده از عبارات و اصطلاحاتی است که توسط اکثریت افراد جامعه به عنوان کنایه شناخته شده اند. به همین منظور در این پژوهش تلاش شده است که تا حد امکان عبارات کنایه دار فارسی جمع آوری شود و موضوع تشخیص خودکار کنایه در جملات فارسی به تشخیص حضور یا عدم حضور این عبارات و اصطلاحات محدود شده است و این اصطلاحات، عبارات کنایه دار نامیده شده اند. به منظور تعیین ویژگی های حضور عبارات کنایه دار در یک جمله، کلمات کلیدی عبارات کنایه دار استخراج شده و با توجه به فراوانی آن ها در مجموعه داده، آن ها از نظر اهمیت به دو نوع اول و دوم تقسیم شده اند. در این پژوهش با استفاده از این کلمات کلیدی، چهار ویژگی برای تشخیص حضور عبارات کنایه دار در یک جمله در نظر گرفته شده است: حضور کلمات کلیدی نوع اول، حضور کلمات کلیدی نوع دوم، هم وقوعی کلمات کلیدی یک عبارت کنایه دار و فاصله بین کلمات یک عبارت کنایه دار در جمله مورد نظر. برای دسته بندی جملات هم روش درخت تصمیم به کار رفته که درخت تصمیم نهایی هرس شده تقریبا دقت 0.72 و صحت 0.96 را نشان داده است. همچنین نشان داده می شود که روش پیشنهادی بسیار بهتر از روش کیسه کلمات عمل می کند.

نویسندگان

آزاده صفیان

دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه صنعتی مالک اشتر تهران

حسین شیرازی

دانشیار دانشگاه صنعتی مالک اشتر تهران

سعیده سادات سدیدپور

دانشجوی دکترای هوش مصنوعی دانشگاه صنعتی مالک اشتر تهران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • شمیسا, سیروس.1370، معانی وبیان, تهران: نشر دانشگاه پیام نور. ...
  • صفوی، کوروش، 1390، از زبان شناسی به ادبیات وسوم .تهران: ...
  • همائی, جلال الدین, 1370، معانی و بیان.: نشر هما. ...
  • Berardi, Giacomo, Andrea Esuli, Diego Marcheggiani, and Fabrizio Sebastiani (2011). ...
  • Breiman, Leo, Jerome H. Friedman, Richard A. Olshen, and Charles ...
  • Burfoot, Clint. & Timothy Baldwin. (2009, August). Automatic satire detection: ...
  • Clark, Herbert H., and Richard J Gerrig (1984). On the ...
  • Davidov, Dmitry, Oren Tsur, and Ari Rappoport. (2010, August). Enhanced ...
  • Davidov, Dmitry, Oren Tsur, and Ari Rappoport. (2010, July). S ...
  • Gibbs, Raymond W. (1986). On the p _ holinguistics of ...
  • Liebrecht, C. C., F. A. Kunneman, and A. P. J. ...
  • Mihalcea, Rada, and Carlo Strapparava, C. (2006). Learning to laugh ...
  • Mihalcea, Rada, and Stephen Pulman, S. (2007). Characterizing humour: An ...
  • Quintilien, Marcus Fabis Quintilianus. (1953). The Instituti, Oratoria of Quintilian: ...
  • Tepperman, Joseph, Traum, R. Traum., & Shrikanth Narayanan. (2006, September). ...
  • Utsumi, Akira. (1999). A computational model of irony interpretation. In ...
  • Utsumi, Akira. (1999). Explaining the time-course of literal and nonliteral ...
  • Utsumi, Akira. (2000). Verbal irony as implicit display of ironic ...
  • نمایش کامل مراجع