做 AI 产品,果然最重要的是「干中学」🥲🥲🥲 昨天只是随便晒一下做的 AI 文件管理工具,没想到这么多人感兴趣。 最初我只是用了 Qwen 2.5 文本分析用于分类。结果评论区在问:能不能直接多模态? 后面和 Gemini 还有 ChatGPT 讨论了一下,即使是本地小模型也能尝试多模态,所以加上了:BGE、CLIP、Whisper、Qwen 一共 4 款 SLM,准备加强对「图像」、「视频」、「PDF」这些文件的整理和检索功能。 😅 今天和 Gemini 一起改了 N 版本了,还只是个雏形。但想想要是能直接靠自然语言检索: 「帮我找出 2025 年末年终有项目总结的那个 PPT」 「找到一下我和妈妈去年去黄山的视频」 那还是挺酷的! 下面是我最新版本尝试的 SLM,欢迎感兴趣的一起讨论!另外我们 Vibe coding 群长期有效,填表就好: