Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

karminski-牙医
En koder, landeveissyklist, serverspåkone, elektronisk avfallsinnsamler, medgründer av KCORES, tidligere direktør i IllaSoft, KingsoftOffice, Juejin.
Ikke skriv oppgaver, men se heller på videoer! Kimi-K2.5 Målt!
Den mørke siden av månen har lansert en ny modell, Kimi-K2.5, og den største oppdateringen er at den endelig har blitt en samlet modell, som ikke bare støtter tekst og bilder, men også videoinput!
Vi gir deg de målte resultatene av Kimi-K2.5-Thinking:
Jeg fant en kul nettside for animasjonseffekter med bakgrunn fra asteroidebeltet + museinteraksjon + rullende bytte, og så spilte jeg inn skjermen til ham, og sendte skjermopptaksvideoen til Kimi-K2.5 – Tenker å gjøre det, jeg gir 80 poeng for denne restaureringen, bortsett fra at den fleksible materialbøyningseffekten ikke er realisert, alt annet er ganske bra.
Detaljer om programmeringstesten: Elefanttannkremtesten eksploderte, og denne effekten føltes vanskelig å matche på kort sikt; Python-koppens hellingstest fulgte direkte Claude-Sonnet, og oppnådde ingen drypping på siden uten hjelp av hypotenuse (selv om det er rom for forbedring i ytelse, partikkelkollisjon er O(n²), 400 partikler telles som 80 000 ganger per bilde, jeg lot det optimaliseres med romlig meshing og det er jevnt).
Agent Ability I kjørte i 40 minutter med en silisiumbasert ryttertest, brukte 10 millioner tokens, og høyeste poengsum var 543,94, som var første nivå. Langtidskontekst-gjenkallingen er også stabil på mer enn 85 %, men sensuren er litt streng, og innholdet i romanen er lett å feiltolke og følsomt (det er rapportert at den offisielle blir revidert).
Sammendrag: Programmeringsalgoritmer og ytelse er forbedret, Python-funksjonalitet er direkte på første nivå, og Agent og lang kontekst er online. Det viktigste er videomodaliteten, jeg har allerede tenkt på en ny måte å spille på – lag et kamera-MCP og la det hjelpe meg å stirre på skjermen haha!
#KimiK25 #Kimi #月之暗面 #KCORES大模型竞技场 #AIAgent #全模态模型 #AI开始使唤AI干活了
DeepSeek-V4 teknisk arkitektur eksponert på forhånd!
Alle vet at den nåværende store MoE-arkitekturen integrerer AIs resonnementsevne og kunnskap i hver ekspert, så er det mulig for eksperter å kun bruke den til resonnement, og deretter lagre en stor mengde ekstern kunnskap i et spesifikt område, og danne en arkitektur som Cyborgen beskrevet i Ghost in the Shell, som faktisk består av elektronisk hjerne + ekstern hukommelse?
DeepSeek har gjort dette!

74
Gode nyheter! Spillkort kan nå bruke SAM-Audio!
For to to dager siden testet jeg Metas nye modell for segmentering av lydspor, SAM-Audio, men det største problemet med denne modellen er at den er for stor, og den store versjonen må bruke 90 GB videominne da jeg målte den. Nå er den gode nyheten at en blogger har fjernet de ubetydelige delene av modellen (encoder og sequencer), faktisk støtter denne modellen også å spesifisere instrumentet til videoen i videoen for ekstraksjon, men det er også mulig å direkte beskrive hvilket instrument som nevnes i teksten. Så denne delen av funksjonen ble fjernet).
For øyeblikket trenger den lille versjonen bare 4-6 GB videominne, og den store versjonen kun 10 GB videominne. Hvis du må hente ut BGM fra sangen eller skille instrumentene, kan venner som trenger vokal prøve det.
Prosjektadresse:

105
Topp
Rangering
Favoritter
