Dacă vrem modele care funcționează în lumea reală, au nevoie de date din lumea reală. Astăzi, echipa @psdnai a publicat o analiză tehnică detaliată a setului de date Poseidon Voice AI. 33k+ ore. 3 săptămâni. Sunet din lumea reală. Limbi cu resurse reduse. Drepturi aprobate pe Poveste ↴
Poseidon
Poseidon29 ian., 01:30
Vă prezentăm setul de date Poseidon Voice AI. 33K+ ore de audio cu drepturi libere în limbi cu resurse reduse. În mai multe limbi, acest lucru depășește anii de colectare publică a datelor. Mai jos, o analiză tehnică aprofundată a datelor ↓
Poseidon prioritizează datele de înaltă calitate, nu doar volumul. Clipurile audio sunt filtrate cu Poseidon Score, un benchmark pentru acuratețea semantică. Validat de vorbitori nativi. Filtrat pentru condiții reale. Resurse scăzute nu mai înseamnă calitate slabă.
7,27K