AI製品を作る際に最も重要なのは「実践しながら学ぶ」🥲🥲🥲ことです 昨日、私はさりげなくAIファイル管理ツールを投稿しましたが、こんなに多くの人が興味を持っているとは思いませんでした。 最初はQwen 2.5のテキスト分析で分類しました。 その結果、コメント欄ではこう問いかけています:直接マルチモーダルになれるのか? 後にGeminiやChatGPTと話し合い、ローカルの小規模モデルでもマルチモーダリティを試せると考え、BGE、CLIP、Whisper、Qwen、合計4つのSLMを追加し、「画像」「動画」「PDF」の整理と検索機能を強化する準備を整えました。 😅 今日、NバージョンをGeminiで変えましたが、まだプロトタイプに過ぎません。 しかし、自然言語で直接検索できると考えてみてください: 「2025年末のプロジェクト概要でPPTを探すのを手伝ってくれ」 「去年、私と母が黄山に行った動画を見つけて」 それはかなりすごいですね! こちらが私の最新バージョンのSLMです。興味があればぜひ一緒に話し合ってください! さらに、私たちのVibeコーディンググループは長期間有効です。フォームにご記入ください: