رامین گودرزی
13 یادداشت منتشر شدهردگیری سویه خاموش: چگونه GNN و LSTM بر روی شبکه های غیرخطی، پاندمی بعدی را ماه ها زودتر پیش بینی می کنند
پاندمی کووید-۱۹ نشان داد که مدل های SIR/SEIR سنتی برای پاسخگویی به جهش های سریع ویروس و رفتارهای پیچیده انسانی بسیار دیر عمل می کنند. نسل جدید پیش بینی پاندمی، مبتنی بر یادگیری عمیق بر روی سه لایه داده ای است:
- لایه ژنومی: تبدیل توالی های اسپایک ویروس به بردارهای تعبیه دار (Sequence-to-Vector با CNN یک بعدی) برای پیش بینی توانایی فرار از ایمنی.
- لایه رفتاری: داده های موقعیت مکانی، جستجوی گوگل، و تراکنش های کارت اعتباری – تغذیه شده به شبکه LSTM دوطرفه برای مدل سازی تغییرات ناگهانی در تحرک جمعیت.
- لایه شبکه ای (GNN - Graph Neural Network): شهرها و مناطق به عنوان گره با یال های مبتنی بر پروازها، تجارت، و حتی تغییرات اقلیمی فصلی. مدل گرافی یاد می گیرد که یک جهش در یک گره، با چه تاخیر زمانی به گره دیگر متاستاز می یابد.
نوآوری کلیدی: «مدل های مولفه نهان پویا» (Dynamic Latent Component Models)
به جای پیش بینی عدد مبتلایان، مدل یک فضای نهان ۵۰بعدی می سازد که هر مولفه آن بیانگر یک «نظام پاندمی» مجزاست (مثلا مولفه اول: سرعت ذاتی انتشار، مولفه دوم: مقاومت به داروهای موجود). تغییرات ناگهانی در یک مولفه، هشدار تکوین سویه جدید را ارسال می کند.
مطالعه موردی:
سیستم "PANDEEMIC-EAR" در اروپا توانست با تحلیل داده های دی ان ای محیطی فاضلاب در نوامبر ۲۰۲۱، افزایش ناگهانی مولفه «فرار از آنتی بادی» را تشخیص دهد – سه ماه قبل از اعلام رسمی سویه اومیکرون.
چالش واقعی، محاسبات نیست؛ عدم اشتراک گذاری داده بین المللی و قوانین حریم خصوصی است. راه حل؟ یادگیری فدرال شده ناهمگن (Heterogeneous Federated Learning) که هر کشور مدل خود را بدون اشتراک داده خام آموزش داده و فقط به روزرسانی گرادیان ها ارسال می کند. آیا آماده طراحی یک سیستم چندعامله برای پیش بینی شیوع توام دو پاندمی (مثلا آنفولانزا و کرونا) هستید؟
رامین گودرزی