Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Je ne vais pas écrire de prompt, je vais plutôt regarder des vidéos ! Test pratique de Kimi-K2.5 !
Le côté obscur de la lune a publié un nouveau modèle Kimi-K2.5, la plus grande mise à jour est qu'il est enfin devenu un modèle unifié, prenant en charge non seulement le texte et les images, mais aussi les entrées vidéo !
Voici les résultats du test pratique de Kimi-K2.5-Thinking :
J'ai trouvé un site web avec un fond d'astéroïdes + interaction avec la souris + un effet d'animation cool avec défilement, puis j'ai enregistré l'écran et j'ai donné la vidéo enregistrée à Kimi-K2.5-Thinking. Pour le niveau de restitution, je donne 80 points, à part l'effet de courbure des matériaux flexibles qui n'a pas été réalisé, tout le reste est plutôt bon.
Détails du test de capacité de programmation : le test du dentifrice éléphant a été incroyable, cet effet semble difficile à égaler à court terme ; le test de versement d'eau dans une tasse en Python est en train de rattraper Claude-Sonnet, réalisant un goutte-à-goutte sans fuite sur le côté sans aide de diagonale (bien que la performance ait de la marge d'amélioration, la collision des particules est O(n²), 400 particules nécessitant 80 000 calculs par image, je l'ai optimisé en utilisant une grille spatiale et c'est devenu fluide).
Pour la capacité d'Agent, j'ai testé avec un cavalier à base de silicium pendant 40 minutes, consommant 10 millions de tokens, avec un score maximum de 543,94, assurément dans le premier groupe. Le rappel de contexte long est également stable à plus de 85 %, mais la censure est un peu stricte, le contenu de roman est facilement mal jugé comme sensible (retour d'information déjà envoyé à l'officiel pour correction).
Résumé : Les algorithmes de programmation et les performances ont été améliorés, la capacité en Python est directement dans le premier groupe, Agent et le contexte long sont en ligne. Le plus important est le mode vidéo, j'ai déjà pensé à un nouveau moyen de faire — créer un MCP de caméra pour qu'il m'aide à surveiller l'écran et à travailler haha !
#KimiK25 #Kimi #月之暗面 #KCORES大模型竞技场 #AIAgent #全模态模型 #AI开始使唤AI干活了
Meilleurs
Classement
Favoris
