Väntade på att detta skulle läggas på Arxiv men vad Dario än säger stämmer överens med våra benchmarks på ROSClaw när vi testar agenter som använder olika robotar. Olika modeller har olika beteendeegenskaper och oro kring interaktion med verkligheten. Mycket märkligt och intressant att observera