Aegaeon: Efektivní sdružování GPU pro souběžné poskytování LLM na trhu Beida a Alibaba Cloud Aegaeon je beta nasazen v Alibaba Cloud Model Studio již více než tři měsíce a v současné době obsluhuje desítky modelů s parametry od 1,8B do 72B. Snižuje počet GPU potřebných pro obsluhu těchto modelů z 1 192 na 213, což zdůrazňuje 82% úsporu zdrojů GPU