Se quisermos modelos que funcionem no mundo real, eles precisam de dados do mundo real. Hoje, a equipe @psdnai publicou uma análise técnica aprofundada sobre o conjunto de dados de IA Poseidon Voice. 33 mil horas. 3 semanas. Áudio do mundo real. Linguagens de poucos recursos. Direitos liberados no Story ↴
Poseidon
Poseidon29 de jan., 01:30
Apresentando o conjunto de dados Poseidon Voice AI. 33K+ horas de áudio com direitos liberados em idiomas de poucos recursos. Em vários idiomas, isso ultrapassa anos de coleta pública de dados. Abaixo, uma análise técnica aprofundada dos dados ↓
Poseidon prioriza dados de alta qualidade, não apenas volume. Clipes de áudio são filtrados com a Pontuação Poseidon, um benchmark de precisão semântica. Validado por falantes nativos. Filtrado para condições do mundo real. Baixo recurso não significa mais baixa qualidade.
7,31K