1/ Wenn DeepSeek-Math-V2 hinter dem kürzlichen Punktesprung auf 38/50 steckt, dann wäre es eine beeindruckende Leistung, ein ~700GB Modell in eine einzelne H100 zu integrieren, die ungefähr 6 Minuten Laufzeit pro Mathematikproblem hat (das sind die Kaggle-Beschränkungen) einen Tag nach ihrer Veröffentlichung.