Bu aslında çılgınca AI ortaya çıktığından beri, biyoloji için her modelin aynı sınırlaması vardı: onu tek bir hastalık üzerinde eğit, sadece o hastalıkta işe yarıyor. Yeni bir ilaç, hasta veya doku için yeniden eğitim al. Biyoloji için temel model vaadi aslında yoktu. sıfır atış tahmini imkansızdı. şimdiye kadar. Arc Institute'un modeli (Stack), hücre gruplarından tek tek öğrenir. LLM'lerin kelimeleri cümlede görme şekli ve izole olarak değil, hücreler birbirleri için bağlam haline gelir. Bir ilaçla tedavi edilen hücreleri gösterebilirsiniz ve aynı ilaca tamamen farklı hücrelerin nasıl yanıt vereceğini tahmin eder. kimse o deneyi yapmamış olsa bile. o doku hiç bozulmamış olsa bile. o kombinasyon eğitimde hiç olmamış olsa bile. hücrelerin kendileri sadece çıkarımdan kaynaklanan promptlara dönüşür. Biyolojiyi şimdi sorgulayabilirsin. "Eğer onlara bu kanser ilacını verirsem karaciğer hücreleri ne yapar?" ve bu gerçek gen ifade tahminleriyle cevap veriyor. Henüz tam olarak değil, ama 31 benchmark'ın 28'inde mevcut yöntemleri geçecek kadar iyi (bu alanda %60'ı geçmenin iyi sayıldığı neredeyse hiç duyulmamış bir durum). Bunu sanal bir perturbasyon atlası oluşturmak için kullandılar: 28 insan dokusu, 40 hücre sınıfı, 201 ilaç. Laboratuvar gerekmiyor. tamamen in silico. Gerçek ıslak laboratuvar deneyleriyle doğrulandığında, tahminler eşleşti. İlaç keşfi şu anda 5M+ dolar ve işe yaramayabilecek bir deney için 2 yıl ücret alıyor. Şimdi önce hesaplamalı olarak tarama yapıyorsunuz. "Hangi dokular hedefin dışında etkiler yaratacak?" "Bu hastanın hücreleri nasıl farklı tepki verecek?" eskiden milyonlarca hibe gerektiren sorular şimdi sadece bir GPU'ya ihtiyaç duyuyor. Yavaş yavaş biyolojiyi çözüyoruz