Jsem teprve 5 měsíců v práci a zdá se, že modely Reasoning potřebují amygdalu Současný přístup (pokud vím) je podobný AlphaGo jen s politickou sítí Nemusí to být samostatný model (později AlphaZero používalo kombinovaný model hodnoty+politiky), ale je potřeba trénovat ten výstup "vyhraju"