مقایسه روش های کلاسیک و روش های مبتنی بر اندازه های آماری پیکرهبنیاد در استخراج خودکار واژه های پایه علوم پزشکی به روش بسامدی

سال انتشار: 1398
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 165

فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JTPSOL-8-1_011

تاریخ نمایه سازی: 2 آذر 1400

چکیده مقاله:

طی دو دهه ی اخیر با پیشرفت علم و فناوری، استفاده از روش های پیکره­بنیاد در آموزش زبان و تدوین منابع درسی گسترش چشمگیری داشته است. پژوهش حاضر با هدف دستیابی به روشی خودکار در استخراج واژه از پیکره ها در زبان فارسی صورت گرفته است. برای دستیابی به هدف پژوهش روش های بسامد شماری در دو گروه کلاسیک و روش های مبتنی بر اندازه های آماری موردبررسی قرارگرفته و توانمندی هریک از که عبارتند از بسامدشماری پیکره ی عمومی، بسامدشماری پیکره ی تخصصی و روش های بهبودیافته ی آن ها موردمقایسه قرارمی گیرند. نتایج نشان می دهد که در روش های کلاسیک با اعمال تکنیک هایی می توان فرایند انتخاب واژه های تخصصی را بهبود بخشید و در این میان بهترین عملکرد مربوط به روش بسامدشماری بهبود یافته در پیکره­ی تخصصی بوده است. روش های به­کاررفته در پژوهش عبارتند از اطلاعات متقابل نقطه­ای و مجذور کا[۱]. نتایج به­دست آمده برای این دو روش نیز قابلیت استفاده از روش های بسامدشماری پیکره­بنیاد در زبان فارسی را مورد تایید قرار می دهد. روش مجذور کا با استخراج %۳۲ واژه­ی تخصصی و روش اطلاعات متقابل نقطه­ای با استخراج %۵۲ واژه­ی تخصصی، عملکرد مناسبی در تشخیص خودکار واژه های تخصصی از خود نشان می دهند. نتایج حاصل از اعمال این روش ها روی پیکره ها و مقایسه آن­ها نشان می­دهند که  می توان از روش های مبتنی بر اندازه­گیری های آماری برای استخراج خودکار واژه در زبان بهره جست و به این ترتیب تحولی نوین در تهیه و تدوین متون آموزشی حاصل خواهد شد و آموزش دهندگان می توانند به فهرست واژگانی دسترسی داشته باشند که دانستن آن برای زبان آموزانشان مفید و گاه ضروری است.  

کلیدواژه ها:

استخراج خودکار واژه های پزشکی ، پیکره ، روش های ترکیبی استخراج ، آموزش زبان فارسی

نویسندگان

زهره ذوالفقار کندری

دانشجوی زبانشناسی همگانی، دانشگاه پیام نور، ایران.

طیبه موسوی میانگاه

دانشیارگروه زبانشناسی همگانی، دانشگاه پیام نور، ایران.

بلقیس روشن

دانشیارگروه زبانشناسی همگانی، دانشگاه پیام نور ، ایران.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • جهانگردی، کیومرث، عاصی، مصطفی، افراشی، آزیتا و وکیلی فرد، امیررضا. ...
  • رسولی، محمدصادق و مینایی بیدگلی، بهروز. (۱۳۸۷). روشی جدید در ...
  • سپهری، مهرداد. (۱۳۹۵). بسامدنگاری و دستاورد های آن در آموزش. ...
  • نعمت زاده، شهین. (۱۳۹۵). واژگان پایه در خدمت تالیف کتاب ...
  • Refrences:Biber, D. (۱۹۹۳) .Representativeness in corpus design. Literary and Linguistic ...
  • Biber,D. (۱۹۹۰). Some methodological Issues in Corpus Based Analyses of ...
  • Bin, H & Zhang, Y. (۲۰۱۳). Automatic Term Extraction in ...
  • Chujo, K., Oghigian, K., Nishigaki, C., Utiyama, M., & Nakamura, ...
  • Chujo, K., Nishigaki, C., & Utiyama, M. (۲۰۰۵). Selecting ۵۰۰ ...
  • Chujo, K., Utiyama, M., & Nakamura, T. (۲۰۰۷). Extracting Level-Specific ...
  • Chujo, K. (۲۰۰۴). Measuring Vocabulary Levels of English Textbooks and ...
  • Coxhead, A., & Nation, P. (۲۰۰۱). The specialised vocabulary of ...
  • Daille, B. (۱۹۹۴). Study and implementation of combined techniques for ...
  • Enguehard, C. & Pantera, L. (۱۹۹۵). Automatic natural acquisition of ...
  • Foo, J. (۲۰۱۲).Computational Terminology: Exploring Bilingual and Monolingual Term Extraction, ...
  • Francis, W. N. (۱۹۹۲). Language corpora BC. In Directions in ...
  • Frantzi, K., Ananiadou, S., & Mima, H. (۲۰۰۰). Automatic recognition ...
  • Gries, S. T. (۲۰۱۰). Useful statistics for corpus linguistics. A ...
  • Granger, S. (۲۰۱۵). The contribution of learner corpora to reference ...
  • Hulth, A. ( ۲۰۰۴). Combining Machine Learning and Natural Language ...
  • McEnery, T. (۲۰۰۱). Corpus linguistics: An introduction. Edinburgh University Press ...
  • Nematzadeh, Sh. (۲۰۱۳). Core Vocabulary Serving the First Grade Primary ...
  • Pantel, Pand. & Lin, D.(۲۰۰۱). A Statistical Corpus-Based Term Extractor. ...
  • Patry, A & .Langlais, P. (۲۰۰۵).Corpus-based terminology extraction. In Terminology ...
  • Rasooli ,M. S. & Minaei-Bidgoli, B. (۲۰۰۸). A new approach ...
  • Rezai, M. J. & Mosavi Miangah, T. (۲۰۱۷). FarsiTag: a ...
  • Sepehri ,M. (۲۰۰۶). Concordancing and its Pedagogical Implications. Language & ...
  • Sinclair, J. (۱۹۹۸). Corpus evidence in language description, In Gerry ...
  • Vulanovic, R. & Mosavi Miangah, T. (۲۰۱۸). A Comparison of ...
  • نمایش کامل مراجع