Таблиця лідерів Obesity ML Challenge починає показувати справжній сигнал! У партнерстві з @Schmidt_Center ми використовуємо машинне навчання для прогнозування, як клітини реагують на зміни, що впливають на розвиток і накопичення жиру. Ми розробили два напрями оцінки, щоб перевірити, наскільки добре моделі передбачають те, що відбувається всередині клітин під час нашого втручання. Ця тема пояснює, як працює таблиця лідерів...
По-перше, що ми маємо на увазі під інтервенцією (або «збуренням») клітини? Порушення — це контрольована зміна, яку ми застосовуємо до клітини, наприклад, вмикаємо/вимикаємо ген або додаємо препарат, щоб побачити, як клітина реагує. Ця відповідь — це те, що ваша модель має передбачити.
Випробування має дві траси, кожна з яких перевіряє різні навики. Трек 1: Транскриптомі-метрики Це допоможе зрозуміти, чи може ваша модель передбачити, як змінюється експресія генів після збурення. Трек 2: Метрики на рівні програми Це допоможе зрозуміти, чи може ваша модель передбачити, у якому стані опиниться клітина.
Трек 1: Транскриптомі-метрики Коли ми порушуємо клітину, тисячі генів можуть змінювати свою активність. Цей трек запитує: Чи передбачала ваша модель, які гени піднялися, які знизилися і на наскільки? Ми оцінюємо це за допомогою двох метрик.
Метрика 1: Pearson Delta Це вимірює, наскільки ваші прогнози близькі до того, що насправді сталося. - Ти передбачив правильний напрямок змін? - Ти передбачив правильну величину? Чим ближчі матчі, тим вищий рахунок.
Метрика 2: Максимальна середня розбіжність (MMD) Замість того, щоб перевіряти гени один за одним, MMD розглядає всю картину. Вона запитує: - Чи виглядає ваш прогнозований розподіл експресії генів як справжній? Це допомагає виявляти моделі, які пропускають загальну структуру.
Трек 2: Метрики рівня програми Гени працюють разом, щоб перевести клітини в біологічний стан. Після збурення клітина може перейти на: - До жиру - зрілий жир - режим зберігання жиру Цей трек перевіряє, чи правильно ваша модель передбачає ці результати.
Ми вимірюємо це за допомогою так званої «L1 відстані». Вона порівнює: - дійсна частка комірок у кожному стані проти - прогнозовані пропорції вашої моделі Чим менша відстань, тим краще розуміє, чим стає клітина.
134