Faire des produits AI, il s'avère que le plus important est d'apprendre en faisant 🥲🥲🥲 Hier, j'ai juste partagé un outil de gestion de fichiers AI que j'ai créé, et je ne m'attendais pas à ce que tant de gens soient intéressés. Au départ, j'ai simplement utilisé l'analyse de texte Qwen 2.5 pour la classification. Les commentaires demandaient : peut-on faire du multimédia directement ? Ensuite, après avoir discuté avec Gemini et ChatGPT, même un petit modèle local peut essayer le multimédia, donc j'ai ajouté : BGE, CLIP, Whisper, Qwen, un total de 4 SLM, et je prévois de renforcer les fonctionnalités d'organisation et de recherche pour les fichiers tels que les "images", "vidéos", "PDF". 😅 Aujourd'hui, avec Gemini, nous avons déjà modifié la version N, et ce n'est encore qu'un prototype. Mais en pensant à la possibilité de rechercher directement par langage naturel : "Aide-moi à trouver le PPT qui a un résumé de projet à la fin de l'année 2025" "Trouve la vidéo de l'année dernière où ma mère et moi sommes allés à Huangshan" Ce serait vraiment cool ! Voici la dernière version de mes essais SLM, n'hésitez pas à en discuter ensemble si cela vous intéresse ! De plus, notre groupe de codage Vibe est toujours actif, il suffit de remplir le formulaire :