O quadro de líderes do Desafio de ML sobre Obesidade está começando a mostrar sinais reais! Em parceria com @Schmidt_Center, estamos usando aprendizado de máquina para prever como as células respondem a mudanças que influenciam o desenvolvimento e armazenamento de gordura. Desenhamos duas trilhas de avaliação para testar quão bem os modelos preveem o que acontece dentro das células quando intervimos nelas. Este tópico explica como funciona o quadro de líderes…
Primeiro, o que queremos dizer com intervir (ou "perturbar") uma célula? Uma perturbação é uma mudança controlada que aplicamos a uma célula, como ativar/desativar um gene ou adicionar um medicamento, para ver como a célula responde. Essa resposta é o que o seu modelo é solicitado a prever.
O desafio tem duas vertentes, cada uma testando uma habilidade diferente. Vertente 1: Métricas de transcriptoma Isto ajudará a responder se o seu modelo pode prever como a expressão gênica muda após uma perturbação. Vertente 2: Métricas a nível de programa Isto ajudará a responder se o seu modelo pode prever em que estado a célula acaba por ficar.
Rastreio 1: Métricas em todo o transcriptoma Quando perturbamos uma célula, milhares de genes podem mudar de atividade. Este rastreio pergunta: O seu modelo previu quais genes aumentaram, quais diminuíram e em que medida? Nós avaliamos isso usando duas métricas.
Métrica 1: Pearson Delta Isto mede quão próximas estão as suas previsões do que realmente aconteceu. - Você previu a direção certa da mudança? - Você previu a magnitude certa? Quanto mais próximas as correspondências, maior a pontuação.
Métrica 2: Discrepância Média Máxima (MMD) Em vez de verificar genes um por um, a MMD analisa o quadro geral. Ela pergunta: - A distribuição de expressão gênica prevista parece com a real? Isto ajuda a detectar modelos que perdem a estrutura geral.
Rastreio 2: Métricas a nível de programa Os genes trabalham juntos para empurrar as células para estados biológicos. Após uma perturbação, uma célula pode mudar para: - pré-gordura - gordura madura - modo de armazenamento de gordura Este rastreio verifica se o seu modelo prevê corretamente esses resultados.
Medimos isso usando algo chamado "distância L1". Compara: - a proporção real de células em cada estado vs - as proporções previstas pelo seu modelo Quanto menor a distância, melhor a compreensão do que a célula se torna.
137