GPU 在不理想的网络框架中花费超过一半的时间在等待数据。谁在为 AI/HPC 工作负载优化网络?