肥満MLチャレンジのリーダーボードが本格的な兆候を見せ始めています! @Schmidt_Centerと協力し、機械学習を用いて脂肪の発生や蓄積に影響を与える変化に対する細胞の反応を予測しています。 私たちは、介入した際に細胞内で起こることをモデルがどれだけ正確に予測するかを検証するために、2つの評価トラックを設計しました。 このスレッドではリーダーボードの仕組みを説明しています...
まず、細胞に介入(または「摂動」)とはどういう意味でしょうか? 摂動とは、遺伝子のオンオフや薬剤の添加など、細胞に適用する制御された変化のことです。細胞の反応を観察するためです。 その反応がモデルに予測を求められるものです。
チャレンジは2つのコースがあり、それぞれ異なるスキルを試します。 トラック1:トランスクリプトーム全体の指標 これにより、あなたのモデルが摂動後の遺伝子発現の変化を予測できるかどうかの答えがつきます。 トラック2:プログラムレベルの指標 これにより、モデルがセルの状態を予測できるかどうかの答えになります。
トラック1:トランスクリプトーム全体の指標 細胞を攪乱すると、何千もの遺伝子が活性を変える可能性があります。 このトラックはこう問いかけています: どの遺伝子が上昇し、どの遺伝子が減少し、どの程度減少したのか、あなたのモデルは予測しましたか? 私たちはこれを2つの指標で評価します。
指標1:ピアソン・デルタ これは、あなたの予測が実際に起こったことにどれだけ近いかを測るものです。 - 変化の正しい方向性を予測しましたか? - 正確な規模を予測しましたか? 試合が近いほどスコアは上がります。
指標2:最大平均差(MMD) 遺伝子を一つずつ調べるのではなく、MMDは全体像を見ます。その質問は以下の通りです。 - 予測された遺伝子発現分布は実際のものに似ていますか? これにより、全体の構造を見落としているモデルを検出するのに役立ちます。
トラック2:プログラムレベルの指標 遺伝子は協力して細胞を生物学的状態に押し上げます。 摂動の後、細胞は次の方向にシフトすることがあります: - プレファット - 成熟脂肪 - ファットストレージモード このトラックは、モデルがこれらの結果を正しく予測しているかを確認します。
これを「L1距離」と呼ばれるもので測定します。 比較すると以下の通りです: - 各状態におけるセルの実の割合 vs - あなたのモデルの予測比率 距離が近ければ短いほど、細胞が何になるかをよりよく理解できます。
135