CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دسته بندی مقالات علمی

عنوان مقاله: بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دسته بندی مقالات علمی
شناسه ملی مقاله: JR_JLRZ-15-49_002
منتشر شده در در سال 1402
مشخصات نویسندگان مقاله:

مریم موسویان - دانشکده مهندسی کامپیوتر، دانشگاه صنعتی امیرکبیر
مسعود قیومی - پژوهشگاه علوم انسانی و مطالعات فرهنگی

خلاصه مقاله:
سالانه پژوهشگران حوزه های مختلف علمی نتایج پژوهش های خود را به صورت گزارش های فنی یا مقالات علمی در مجموعه مقالات یا مجلات منتشر می کنند. گردآوری این نوع داده توسط موتورهای جستجو و کتابخانه های دیجیتال برای جستجو و دسترسی به نشریات تحقیقاتی استفاده می شود که معمولا مقالات مرتبط براساس کلیدواژه های پرسمان به جای موضوعات مقاله بازیابی می گردد. در نتیجه، دسته بندی دقیق مقالات علمی می تواند کیفیت جستجوی کاربران را هنگام جستجوی یک سند علمی در پایگاه های اطلاعاتی افزایش دهد.هدف اصلی این مقاله، ارائه یک مدل دسته بندی برای تعیین موضوع مقالات علمی است. برای این منظور، مدلی را پیشنهاد کردیم که از دانش بافتی غنی شده مقالات فارسی مبتنی بر معناشناسی توزیعی استفاده می کند. بر این اساس، شناسایی حوزه خاص هر سند و تعیین دامنه آن توسط دانش غنی برجسته، دقت دسته بندی مقالات علمی را افزایش می دهد. برای رسیدن به هدف، ما مدل های درونه یابی بافتی، اعم از ParsBERT یا XLM-RoBERTa را با موضوعات پنهان در مقالات را برای آموزش یک مدل پرسپترون چندلایه غنی می کنیم. بر اساس نتایج تجربی، عملکرد کلی ParsBERT-NMF-۱HT ۷۲/۳۷ درصد (ماکرو) و ۷۵/۲۱ درصد (میکرو) بر اساس معیار اف بود که تفاوت عملکرد این مدل در مقایسه با مدل پایه از نظر آماری معنادار (p<۰.۰۵) بود.

کلمات کلیدی:
بازنمایی بافتی, معناشناسی توزیعی, شبکه عصبی, دسته بندی مقالات علمی, مدل سازی موضوع

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1919027/