"Hipotesis Prisma" Makalah baru ini menunjukkan bahwa makna gambar sebagian besar hidup dalam sinyal frekuensi rendah, sementara detail seperti tekstur hidup dalam frekuensi tinggi Dengan mengeksploitasi pemisahan ini, penulis membangun satu ruang laten yang mendukung pemahaman (gaya CLIP) dan generasi (gaya VAE), jadi tidak ada lagi pertukaran semantik vs kesetiaan