Die Vorhersage des Zellzustands unter zuvor unbekannten Bedingungen wie Krankheiten oder als Reaktion auf ein Medikament erforderte typischerweise ein erneutes Training für jeden neuen biologischen Kontext. Heute veröffentlicht Arc Stack, ein Fundamentmodell, das lernt, den Zellzustand unter neuartigen Bedingungen direkt zur Inferenzzeit zu simulieren, ohne dass eine Feinabstimmung erforderlich ist.
Stack erfasst etwas, das die meisten Modelle übersehen: den zellulären Kontext. Eine T-Zelle im entzündeten Gewebe verhält sich anders, nicht nur wegen ihrer eigenen Gene, sondern auch wegen ihrer Umgebung. Stack verarbeitet Zellen gemeinsam und lernt aus diesen Beziehungen.
So wie Textaufforderungen Sprachmodelle leiten, dienen Zellen als Aufforderungen in Stack. Es kann medikamentenbehandelte Immunzellen beobachten und vorhersagen, wie Epithelzellen auf dasselbe Medikament reagieren würden, eine Aufgabe, für die nie explizit trainiert wurde. Es ist das erste Einzelzell-Grundlagenmodell, das in der Lage ist, kontextuelles Lernen zu betreiben oder während der Inferenz auf neue Aufgaben zu verallgemeinern.
Das Team hat Stack angewendet, um Perturb Sapiens zu erstellen: Ein Atlas von ~20.000 vorhergesagten Zellantworten über 28 Gewebe und 201 Störungen + ein Teil, der mit zurückgehaltenen Datensätzen validiert wurde, was bestätigt, dass die Vorhersagen die reale Biologie erfassen.
323