O ranking do Desafio de Aprendizagem da Obesidade está começando a mostrar sinais reais! Em parceria com a @Schmidt_Center, estamos usando aprendizado de máquina para prever como as células respondem a mudanças que influenciam o desenvolvimento e o armazenamento de gordura. Projetamos duas trilhas de avaliação para testar o quão bem os modelos preveem o que acontece dentro das células quando intervimos nelas. Este tópico explica como funciona o ranking...
Primeiro, o que queremos dizer com intervir (ou "perturbar") uma célula? Uma perturbação é uma mudança controlada que aplicamos a uma célula, como ligar/desligar um gene ou adicionar um medicamento, para ver como a célula responde. Essa resposta é o que seu modelo é solicitado a prever.
O desafio tem duas pistas, cada uma testando uma habilidade diferente. Faixa 1: Métricas em todo o transcriptoma Isso ajudará a responder se seu modelo consegue prever como a expressão gênica muda após uma perturbação. Trilha 2: Métricas em nível de programa Isso ajudará a responder se seu modelo consegue prever em que estado a célula acaba.
Faixa 1: Métricas em todo o transcriptoma Quando perturbamos uma célula, milhares de genes podem mudar de atividade. Esta faixa pergunta: Seu modelo previa quais genes aumentavam, quais diminuíam e em quanto? Avaliamos isso usando dois critérios.
Métrica 1: Delta de Pearson Isso mede o quão próximas estão suas previsões do que realmente aconteceu. - Você previu a direção certa da mudança? - Você previu a magnitude certa? Quanto mais perto as lutas, maior a pontuação.
Métrica 2: Discrepância Média Máxima (MMD) Em vez de checar os genes um por um, o MMD analisa o quadro completo. Ele pergunta: - Sua distribuição prevista de expressão gênica parece a real? Isso ajuda a detectar modelos que não têm estrutura geral.
Trilha 2: Métricas em nível de programa Os genes trabalham juntos para empurrar as células para estados biológicos. Após uma perturbação, uma célula pode se deslocar para: - pré-gordura - gordura madura - modo de armazenamento de gordura Essa trilha verifica se seu modelo prevê esses resultados corretamente.
Medimos isso usando algo chamado "distância L1". Ele compara: - a proporção real de células em cada estado vs - as proporções previstas do seu modelo Quanto menor a distância, melhor é a compreensão do que a célula se torna.
116