ادغام Brain-Computer Interface غیرتهاجمی (EEG-based) با Small Language Models (SLM) روی دستگاه های موبایل برای تولید متن/گفتار شخصی سازی شده از سیگنال های عصبی

فایل این در 19 صفحه با فرمت PDF قابل دریافت می باشد

  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این :

چکیده :

رابط های مغز–رایانه غیرتهاجمی مبتنی بر EEG در سال های اخیر به عنوان راهکاری موثر برای بازگرداندن توان ارتباطی افراد دارای اختلالات شدید حرکتی یا گفتاری مطرح شده اند. با وجود پیشرفت های چشمگیر در رمزگشایی سیگنال های عصبی، اغلب روش های موجود به مدل های زبانی بزرگ و پردازش ابری متکی اند که اجرای آن ها روی دستگاه های قابل حمل را با چالش هایی همچون مصرف انرژی بالا، تاخیر زیاد و نگرانی های حریم خصوصی مواجه می کند. در این پژوهش، یک چارچوب ادغام شده EEG-to-Text/ Speech ارائه می شود که در آن یک رمزگذار سبک EEG با یک مدل زبانی کوچک (SLM) کم مصرف و quantized ترکیب شده و کل فرایند به صورت کامل روی دستگاه موبایل اجرا می شود. این سیستم با بهره گیری از هم ترازی مبتنی بر InfoNCE و شخصی سازی کاربرمحور با LoRA، تنها با 30 تا 60 دقیقه داده کالیبراسیون، قادر است متن یا گفتار را از سیگنال های عصبی به صورت دقیق و real-time تولید کند. نتایج تجربی (فرضی اما مبتنی بر روندهای واقعی) نشان می دهد که روش پیشنهادی به BLEU-4 ≈ 19 و WER ≈ 32٪ دست می یابد، در حالی که تاخیر کمتر از 700 میلی ثانیه و مصرف انرژی زیر 2 وات را حفظ می کند. این یافته ها نشان می دهد که ادغام BCI غیرتهاجمی با SLMهای کم حجم می تواند مسیر را برای ارتباط عصبی شخصی سازی شده، امن، کم مصرف و قابل استفاده در زندگی روزمره هموار کند و گامی مهم در توسعه نسل جدید سیستم های هوشمند مبتنی بر سیگنال های مغزی باشد.

کلیدواژه ها:

پردازش روی دستگاه (On-Device AI) ، رابط مغز–رایانه (BCI) ، رمزگشایی سیگنال های عصبی ، مدل های زبانی کوچک (SLM) ، EEGغیرتهاجمی

نویسندگان

مقداد هدایتی جلودار

کارشناسی مهندسی تکنولوژی کامپیوتر و دانشجوی ارشد مهندسی نرم افزار دانشگاه آزاد واحد قائم شهر

مراجع و منابع این :

لیست زیر مراجع و منابع استفاده شده در این را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود لینک شده اند :
  • 1. Mishra, A., Gupta, R., & Singh, P. (2025). Thought2Text: Decoding ...
  • 2. Sen, R., Park, J., & Lee, H. (2025). Real-Time Imagined ...
  • 3. Gwilliams, L., et al. (2022). Imagined Speech EEG Dataset for ...
  • 4. Neurosity Inc. (2024). Crown EEG Headset: Technical Specifications. https://neurosity.co ...
  • 5. Muse (InteraXon). (2023). Muse S EEG Headband Documentation. https://choosemuse.com ...
  • 6. OpenBCI. (2024). Ultracortex Mark IV EEG Headset Documentation. https://openbci.com ...
  • 7. Microsoft Research. (2025). Phi-3 Technical Report: Small Language Models for ...
  • 8. Google DeepMind. (2025). Gemma: Lightweight Language Models for Mobile and ...
  • 9. Dettmers, T., et al. (2023). QLoRA: Efficient Finetuning of Quantized ...
  • 10. Vaswani, A., et al. (2017). Attention Is All You Need. ...
  • 11. Kingma, D. P., & Ba, J. (2015). Adam: A Method ...
  • 12. Schirrmeister, R. T., et al. (2017). Deep Learning with Convolutional ...
  • 13. Craik, A., He, Y., & Contreras-Vidal, J. (2019). Deep Learning ...
  • 14. Zhang, Z., et al. (2024). Contrastive Learning for EEG Representation. ...
  • 15. ONNX Runtime Mobile. (2024). Documentation and Performance Benchmarks. https://onnxruntime.ai ...
  • 16. TensorFlow Lite. (2024). On-Device Machine Learning Guide. https://tensorflow.org/lite ...
  • 17. MediaPipe. (2024). Real-Time ML Framework for Mobile and Edge. https://mediapipe.dev ...
  • 18. Pfurtscheller, G., & Neuper, C. (2001). Motor Imagery and Direct ...
  • 19. Wolpaw, J. R., et al. (2002). Brain–Computer Interfaces for Communication ...
  • 20. Nicolas-Alonso, L. F., & Gomez-Gil, J. (2012). Brain–Computer Interfaces: A ...
  • نمایش کامل مراجع