Spoluzakladatelé @flappyairplanes současný RL model tréninku nazývají "environmentální slop". Vysvětlují: "Dnešní paradigmata posilování jsou šokujícím způsobem neefektivní. Moc zobecnění mezi úkoly nemáte, model učíte jedním typem učení a pak dalším. Je to trochu jako hra na krtka. Když se na to podíváme, přijde nám to trochu šílené. Dalším paradigmatem AI nebude environmentální kaše." "Inteligence na lidské úrovni není strop, je to jen dno toho, co je možné. Pokud dokážete trénovat modely s mnohem menším množstvím dat a možná větším výpočetním výkonem velmi odlišnými způsoby, co se stane? Vlastně to nevíme. Ale myslím, že budou odlišné a zvláštní a budou mít zajímavé schopnosti, které najdeme opravdu cenné způsoby, jak je využít."