CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

پیکره چکیده های مقالات و پایان نامه های دانشگاهی دانشگاه علامه طباطبائی

عنوان مقاله: پیکره چکیده های مقالات و پایان نامه های دانشگاهی دانشگاه علامه طباطبائی
شناسه ملی مقاله: JR_LSI-18-35_007
منتشر شده در در سال 1401
مشخصات نویسندگان مقاله:

آزاده میرزائی - دانشگاه علامه طباطبائی
فاطمه صدقی - کارشناسی ارشد هوش مصنوعی دانشگاه الزهرا

خلاصه مقاله:
این مقاله از نحوه شکل گیری پیکره «چکیده های مقالات و پایان نامه های دانشگاهی دانشگاه علامه طباطبائی» و همچنین از ویژگی ها و امکانات آن می گوید. داده های این پیکره شامل ده هزار چکیده پایان نامه و ۹۵۳۸ چکیده مقاله (برگرفته از نشریات علمی دانشگاه علامه طباطبائی) با حجمی در حدود سه و نیم میلیون موردواژه است که در قالب طرح پژوهشی گردآوری شده اند. اهمیت داده های این پیکره یعنی چکیده های دانشگاهی از آن جهت است که این نوع داده ها به عنوان متون تالیفی فشرده و با محتوای علمی می توانند تصویرگر ویژگی های خاص زبان علم به عنوان گونه ای از زبان باشند. در این نوشتار برای بیان اهمیت دسترسی به چنین داده هایی و به جهت بررسی امکانات پیکره، محتوای واژه ای بخشی از داده با توجه به مفهوم کلیدی بودگی و فهرست چندپشته ها مورد بررسی قرار گرفت. بررسی ها نشان داد محتوای واژگانی این پیکره می تواند پژوهشگران را به سوی طرح برخی فرضیه ها سوق دهد. همچنین بررسی چندپشته های داده های علمی نشان داد که زبان علم دارای توالی های واژه ای مشخصی است که می تواند تصویرگر نوع خاصی از زبان باشد.

کلمات کلیدی:
پیکره, زبان علم, کلیدی بودگی, چندپشته, زبان فارسی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1776993/