Os LLMs seriam 100x mais fáceis de construir coisas interessantes se não tivéssemos que otimizar para acertos de cache, para ser sincero.