Wenn wir Modelle wollen, die in der realen Welt funktionieren, benötigen sie Daten aus der realen Welt. Heute hat das @psdnai-Team einen technischen Deep Dive zum Poseidon Voice AI-Datensatz veröffentlicht. Über 33.000 Stunden. 3 Wochen. Audio aus der realen Welt. Sprachen mit wenig Ressourcen. Rechte geklärt auf Story ↴
Poseidon
Poseidon29. Jan., 01:30
Einführung des Poseidon Voice AI-Datensatzes. Über 33.000 Stunden an rechtlich freigegebenem Audio in ressourcenarmen Sprachen. In mehreren Sprachen übersteigt dies Jahre der öffentlichen Datensammlung. Unten finden Sie einen technischen tiefen Einblick in die Daten ↓
Poseidon priorisiert hochwertige Daten, nicht nur das Volumen. Audioclips werden mit dem Poseidon Score gefiltert, einem Maßstab für semantische Genauigkeit. Validiert von Muttersprachlern. Gefiltert für reale Bedingungen. Wenig Ressourcen bedeuten nicht mehr geringe Qualität.
7,11K