توسعه ی مدل ترکیبی برای تفسیر عکس و گزارشهای پزشکی با استفاده از BioMistral و ConceptCLIP

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 19

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICPCONF11_141

تاریخ نمایه سازی: 1 آذر 1404

چکیده مقاله:

در این مقاله روشی نوین برای تفسیر خودکار تصاویر پزشکی با استفاده از مدل چندوجهی ConceptCLIP و مدل زبانی BioMistral ارائه شده است. برای افزایش دقت و توضیح پذیری سامانه، توابع زیان جدیدی مانند Confidence، DCL LOSS، Triplet Loss و Group XAI طراحی شده اند. این سامانه علاوه بر تحلیل تصاویر قفسه سینه، پیشنهادهای تغذیه و سبک زندگی بر مبنای گزارشهای پزشکی ارائه می دهد. نتایج نشان می دهد سیستم در مقایسه با مدل های پایه مانند CLIP، عملکرد بهتری در تفسیر دقیق و مشابه یابی معنایی دارد. همچنین با استفاده از ماژول های توضیح پذیری بصری (Visual XAI)، نواحی آسیب دیده به خوبی شناسایی می شوند.

نویسندگان

یاسمن اولیایی فسخودی

دانشجوی کارشناسی مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد تهران مرکزی

رضا روان مهر

دانشیار و عضو هیئت علمی، دانشگاه آزاد اسلامی واحد تهران مرکزی