做 AI 產品,果然最重要的是「幹中學」🥲🥲🥲 昨天只是隨便曬一下做的 AI 文件管理工具,沒想到這麼多人感興趣。 最初我只是用了 Qwen 2.5 文本分析用於分類。結果評論區在問:能不能直接多模態? 後面和 Gemini 還有 ChatGPT 討論了一下,即使是本地小模型也能嘗試多模態,所以加上了:BGE、CLIP、Whisper、Qwen 一共 4 款 SLM,準備加強對「圖像」、「視頻」、「PDF」這些文件的整理和檢索功能。 😅 今天和 Gemini 一起改了 N 版本了,還只是個雛形。但想想要是能直接靠自然語言檢索: 「幫我找出 2025 年末年終有項目總結的那個 PPT」 「找到一下我和媽媽去年去黃山的視頻」 那還是挺酷的! 下面是我最新版本嘗試的 SLM,歡迎感興趣的一起討論!另外我們 Vibe coding 群長期有效,填表就好: