Z-Image Turbo — це нова модель Text to Image з відкритими вагами #1, перевершуючи FLUX.2 [dev], HunyuanImage 3.0 (Fal) та Qwen-Image у сфері штучного аналізу зображень. Z-Image Turbo — це перша модель, випущена командою Alibaba Tongyi-MAI (окремо від команд Alibaba Wan і Qwen), і коштує $5/1k зображень на Alibaba Cloud, що робить її однією з найдешевших моделей зображень — вона дешевша за FLUX.2 [dev] ($12/1k зображень), HiDream-I1-Dev ($26/1k зображення) та Qwen-Image ($20/1k зображень). Це модель з параметрами 6B, яка може працювати на споживчому обладнанні з лише 16 ГБ пам'яті. Z-Image Turbo випущений під ліцензією Apache 2.0 з відкритим кодом, що дозволяє комерційне використання без обмежень. Він доступний через API на Alibaba Cloud, fal та Replicate. Дивіться нижче порівняння Z-Image Turbo та інших провідних моделей відкритих ваг у нашій сфері 🧵 штучного аналізу зображень
[Запит 1/5]: Фотографічна сцена помірного тропічного лісу, мох, що вкриває масивні кедрові стовбури, лісова підлога густо вкрита папоротеми, а ніжний дощ тихо барабанить по широкому листку.
[Запит 2/5]: Величезна саванна на заході сонця, фотореалістично зафіксована, золотисті трави танцюють у легкому вітрі, а стадо гну спокійно пасе вдалині, а левиця спостерігає з тіні акації.
[Запит 3/5]: Запуск ракети з Європи, одного з супутників Юпітера. Крижана поверхня відбиває полум'я ракети. Юпітер височіє в чорному небі, його смуги та Велика Червона Пляма чітко видно. Вихлопні гази ракети створюють тимчасову атмосферу, яка швидко розсіюється.
[Підказка 4/5]: Двоє підлітків-головних героїв у футуристичному аніме-світі: один тримає сяючу голографічну карту з синіми схемами, а інший налаштовує кібернетичні окуляри маленьким зеленим світлом. Вони стоять на платформі з видом на розлоге неоново освітлене місто.
[Підказка 5/5]: акварельна картина вокзалу 1940-х років: мандрівники в капелюхах і пальтах шикуються в чергу, паровоз розвіває білі пір'я, а кондуктор називає час.
Дивіться Z-Image Turbo у арені штучного аналізу зображень самостійно:
1,44K