2.5倍速いのに、6倍のコストがかかります。 これは推論最適化では実現できず、新しいチップが必要です。 TPU?B200?AWS Inferentia?脳?