کاهش مصرف VRAM با حفظ دقت در تنظیم کممنبع NL۲SQL : مطالعه ی موردی QLoRA بر Llama-۲-۷B

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 21

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

AICNF02_023

تاریخ نمایه سازی: 31 مرداد 1404

چکیده مقاله:

در این پژوهش، کارایی روش تنظیم دقیق کممنبع QLoRA در بهینه سازی مصرف حافظه ی گرافیکی (VRAM) برای سامانه های تبدیل زبان طبیعی به SQL (NL۲SQL) مورد بررسی قرار گرفته است. هدف اصلی، کاهش محسوس مصرف منابع محاسباتی بدون افت معنادار در دقت اجرای کوئری بود. برای این منظور، مدل Llama-۲-۷B بر روی مجموعه داده ی استاندارد Spider آموزش داده شد. سه سناریو شامل تنظیم کامل (Full Fine-Tuning)، تنظیم دقیق با LoRA و تنظیم دقیق با QLoRA پیاده سازی گردید. نتایج تجربی نشان داد که استفاده از QLoRA مصرف حافظه ی گرافیکی را تا ۱۷ درصد نسبت به حالت تنظیم کامل کاهش داده و زمان آموزش را نیز به طور قابل توجهی کمتر کرده است. به رغم این کاهش در مصرف منابع، میزان دقت اجرای کوئری تنها حدود ۰٫۹ درصد افت داشت که از نظر آماری معنادار نبود. این یافته ها نشان می دهد که QLoRA می تواند به عنوان یک راهکار موثر و اقتصادی برای استقرار سامانه های NL۲SQL در محیط های دارای محدودیت سخت افزاری مورد استفاده قرار گیرد. همچنین، این مطالعه بر اهمیت استفاده از تکنیک های کممنبع در راستای توسعه ی سامانه های هوشمند پایدار و بهینه تاکید می کند. در پایان، مسیرهای آینده برای بهبود بیشتر با ترکیب QLoRA با سایر روش های فشرده سازی پیشنهاد شده است.

نویسندگان

امید جعفرزاده خوشرودی

استادیار مهندسی کامپیوتر- سیستم های نرم افزاری، دانشگاه آزاد اسلامی واحد بهشهر

محمد جعفری فوتمی

دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی واحد بهشهر