Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Comment entraîner un modèle lorsqu’aucune donnée d’entraînement n’existe ?
C’est ce que Team Cellmates a abordé dans Autoimmune ML Challenge II de CrunchDAO.
1. Marios Gavrielatos (@MariosGvr)
2. Konstantinos Kyriakidis (@kokyriakidis)
Voici comment ils ont procédé 👇

Le défi consistait à prédire l’expression de 2 000 gènes à partir d’images de tissu du côlon.
Mais les échantillons spatiaux avec cette couverture génique n’existent pas. Ils ont donc mis en place une solution de contournement en utilisant l’expression génique connue à partir de profils cellulaires similaires.
Ils ont commencé par leur modèle personnalisé crunch1 pour prédire 460 valeurs d’expression génique à partir de vecteurs extraits d’images colorées par H&E à plusieurs niveaux de zoom.
Le modèle a été optimisé pour minimiser l’erreur quadratique moyenne et rester proche de la vérité fondamentale.
Ensuite, ils ont recherché les 5 échantillons cellulaires les plus similaires pour chaque image spatiale en utilisant l’algorithme FAISS, en correspondant sur l’ensemble complet de 2 000 gènes cibles.
Chaque voisin fournissait un contexte biologique précieux pour la prédiction en aval.
Pour chaque échantillon, ils ont créé un tableau (5 2458) combinant les 458 gènes prédits et 2 000 gènes de chacun des 5 plus proches voisins.
Cette entrée structurée est devenue la base du modèle à deuxième étage.
L’objectif de ce modèle était de prédire l’expression moyenne des gènes de ces 5 voisins à travers les 2 000 gènes cibles.
En traitant cette moyenne comme un proxy de la vérité sur le terrain, ils ont créé une tâche supervisée à partir de données non supervisées.
Le résultat fut un pipeline à deux modèles capturant des signaux au niveau des gènes à partir de données d’images grâce à l’ingénierie intelligente des fonctionnalités et à la supervision proxy.
Ça a marché. Leur solution a surpassé des centaines d’autres dans un défi biomédical mondial.
Team Cellmates a montré qu’avec la bonne structure et raisonnement, même des données imparfaites peuvent être transformées en puissants signaux d’apprentissage.
Leur solution est un rappel que la modélisation créative compte autant que les données brutes.
150
Meilleurs
Classement
Favoris
