Papan peringkat Obesity ML Challenge mulai menunjukkan sinyal nyata! Dalam kemitraan dengan @Schmidt_Center, kami menggunakan pembelajaran mesin untuk memprediksi bagaimana sel merespons perubahan yang memengaruhi perkembangan dan penyimpanan lemak. Kami merancang dua jalur evaluasi untuk menguji seberapa baik model memprediksi apa yang terjadi di dalam sel ketika kami mengintervensi di dalamnya. Utas ini menjelaskan cara kerja papan peringkat...
Pertama, apa yang kita maksud dengan mengintervensi (atau "mengganggu") sel? Gangguan adalah perubahan terkontrol yang kita terapkan pada sel, seperti menghidupkan/mematikan gen atau menambahkan obat, untuk melihat bagaimana sel merespons. Respons itulah yang diminta untuk diprediksi oleh model Anda.
Tantangannya memiliki dua trek, masing-masing menguji keterampilan yang berbeda. Jalur 1: Metrik seluruh transkriptom Ini akan membantu menjawab apakah model Anda dapat memprediksi bagaimana ekspresi gen berubah setelah gangguan. Jalur 2: Metrik tingkat program Ini akan membantu menjawab apakah model Anda dapat memprediksi keadaan sel berakhir.
Jalur 1: Metrik seluruh transkriptom Ketika kita mengganggu sel, ribuan gen dapat mengubah aktivitas. Lagu ini bertanya: Apakah model Anda memprediksi gen mana yang naik, mana yang turun, dan berapa banyak? Kami mengevaluasi ini menggunakan dua metrik.
Metrik 1: Delta Pearson Ini mengukur seberapa dekat prediksi Anda dengan apa yang sebenarnya terjadi. - Apakah Anda memprediksi arah perubahan yang benar? - Apakah Anda memprediksi besarnya yang tepat? Semakin dekat pertandingan, semakin tinggi skornya.
Metrik 2: Perbedaan Rata-Rata Maksimum (MMD) Alih-alih memeriksa gen satu per satu, MMD melihat gambaran keseluruhan. Ia bertanya: - Apakah distribusi ekspresi gen yang Anda prediksi terlihat seperti yang asli? Ini membantu mendeteksi model yang melewatkan struktur keseluruhan.
Jalur 2: Metrik tingkat program Gen bekerja sama untuk mendorong sel ke keadaan biologis. Setelah gangguan, sel dapat bergeser menjadi: - pra lemak - lemak matang - mode penyimpanan lemak Jalur ini memeriksa apakah model Anda memprediksi hasil ini dengan benar.
Kami mengukur ini menggunakan sesuatu yang disebut "jarak L1". Ini membandingkan: - proporsi sel yang sebenarnya di setiap negara bagian vs - Proporsi yang diprediksi model Anda Semakin rendah jarak, semakin baik pemahaman tentang apa yang menjadi sel.
126