Agen peneliti matematika DeepMind(@GoogleDeepMind), Aletheia, mencapai skor 91,9% pada IMO-Proofbench Advanced. Kinerja ini melampaui skor Gemini Deep Think versi Lanjutan pada Januari 2026, sekaligus mengurangi biaya komputasi. Mereka sekarang memperluas pendekatan ini ke fisika dan ilmu komputer, memanfaatkan Gemini Deep Think yang canggih untuk mendorong terobosan ilmiah.