Ich bin erst 5 Minuten drin und es scheint offensichtlich, dass die Denkmodelle eine Amygdala brauchen. Der aktuelle Ansatz (soweit ich weiß) ist wie AlphaGo mit nur einem Politiknetzwerk. Es muss kein separates Modell sein (später verwendete AlphaZero ein kombiniertes Wert- und Politikmodell), aber man muss diesen "Gewinne ich?"-Output trainieren.