Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Wie trainiert man ein Modell, wenn keine Trainingsdaten vorhanden sind?
Das ist es, was Team Cellmates in der Autoimmune ML Challenge II von CrunchDAO in Angriff genommen hat.
1. Marios Gavrielatos (@MariosGvr)
2. Konstantinos Kyriakidis (@kokyriakidis)
So haben sie es 👇 gemacht

Die Herausforderung bestand darin, die Expression von 2.000 Genen aus Bildern des Dickdarmgewebes vorherzusagen.
Aber räumliche Stichproben mit dieser Genabdeckung gibt es nicht. Also entwickelten sie einen Workaround mit bekannter Genexpression aus ähnlichen Einzelzellprofilen.
Sie begannen mit ihrem benutzerdefinierten crunch1-Modell, um 460 Genexpressionswerte von Vektoren vorherzusagen, die aus H&E-gefärbten Bildern in mehreren Zoomstufen extrahiert wurden.
Das Modell wurde optimiert, um den mittleren quadratischen Fehler zu minimieren und nahe an der Grundwahrheit zu bleiben.
Dann suchten sie mit dem FAISS-Algorithmus nach den 5 ähnlichsten Einzelzellproben für jedes räumliche Bild und stimmten mit dem vollständigen Satz von 2.000 Zielgenen überein.
Jeder Nachbar lieferte wertvollen biologischen Kontext für die Vorhersage flussabwärts.
Für jede Probe erstellten sie ein (5, 2458) Array, das die 458 vorhergesagten Gene und 2.000 Gene von jedem der 5 nächsten Nachbarn kombinierte.
Dieser strukturierte Input wurde zur Grundlage für das Modell der zweiten Stufe.
Das Ziel dieses Modells war es, die durchschnittliche Genexpression dieser 5 Nachbarn über alle 2.000 Zielgene hinweg vorherzusagen.
Indem sie diesen Durchschnitt als Proxy für die Grundwahrheit behandelten, erstellten sie eine überwachte Aufgabe aus unüberwachten Daten.
Das Ergebnis war eine Pipeline mit zwei Modellen, die Signale auf Genebene aus Bilddaten mit Hilfe von Smart Feature Engineering und Proxy-Supervision erfasste.
Es hat funktioniert. Ihre Lösung übertraf Hunderte von anderen in einer globalen biomedizinischen Herausforderung.
Team Cellmates zeigte, dass mit der richtigen Struktur und Argumentation selbst unvollkommene Daten in starke Lernsignale umgewandelt werden können.
Ihre Lösung ist eine Erinnerung daran, dass kreative Modellierung genauso wichtig ist wie Rohdaten.
139
Top
Ranking
Favoriten
