بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دسته بندی مقالات علمی

سال انتشار: 1402
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 27

فایل این مقاله در 29 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JLRZ-15-49_002

تاریخ نمایه سازی: 30 بهمن 1402

چکیده مقاله:

سالانه پژوهشگران حوزه های مختلف علمی نتایج پژوهش های خود را به صورت گزارش های فنی یا مقالات علمی در مجموعه مقالات یا مجلات منتشر می کنند. گردآوری این نوع داده توسط موتورهای جستجو و کتابخانه های دیجیتال برای جستجو و دسترسی به نشریات تحقیقاتی استفاده می شود که معمولا مقالات مرتبط براساس کلیدواژه های پرسمان به جای موضوعات مقاله بازیابی می گردد. در نتیجه، دسته بندی دقیق مقالات علمی می تواند کیفیت جستجوی کاربران را هنگام جستجوی یک سند علمی در پایگاه های اطلاعاتی افزایش دهد.هدف اصلی این مقاله، ارائه یک مدل دسته بندی برای تعیین موضوع مقالات علمی است. برای این منظور، مدلی را پیشنهاد کردیم که از دانش بافتی غنی شده مقالات فارسی مبتنی بر معناشناسی توزیعی استفاده می کند. بر این اساس، شناسایی حوزه خاص هر سند و تعیین دامنه آن توسط دانش غنی برجسته، دقت دسته بندی مقالات علمی را افزایش می دهد. برای رسیدن به هدف، ما مدل های درونه یابی بافتی، اعم از ParsBERT یا XLM-RoBERTa را با موضوعات پنهان در مقالات را برای آموزش یک مدل پرسپترون چندلایه غنی می کنیم. بر اساس نتایج تجربی، عملکرد کلی ParsBERT-NMF-۱HT ۷۲/۳۷ درصد (ماکرو) و ۷۵/۲۱ درصد (میکرو) بر اساس معیار اف بود که تفاوت عملکرد این مدل در مقایسه با مدل پایه از نظر آماری معنادار (p<۰.۰۵) بود.

کلیدواژه ها:

نویسندگان

مریم موسویان

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی امیرکبیر

مسعود قیومی

پژوهشگاه علوم انسانی و مطالعات فرهنگی