Tekoälytuotteita tehdessä tärkeintä on "oppia tekemällä" 🥲🥲🥲 Eilen julkaisin vain satunnaisesti tekoälytiedostojen hallintatyökalun, mutta en odottanut niin monen olevan kiinnostunut. Aluksi käytin luokitteluun Qwen 2.5 -tekstianalyysiä. Tämän seurauksena kommenttialue kysyy: Voiko se olla suoraan multimodaalinen? Myöhemmin keskustelin Geminin ja ChatGPT:n kanssa, että jopa paikalliset pienet mallit voivat kokeilla multimodaalisuutta, joten lisäsin: BGE, CLIP, Whisper, Qwen, yhteensä 4 SLM:ää, valmiina vahvistamaan "kuvien", "videoiden" ja "PDF":n organisointi- ja hakutoimintoja. 😅 Tänään vaihdoin N-version Geminiin, ja se on edelleen vasta prototyyppi. Mutta ajattele, että se voisi hakea suoraan luonnollisen kielen avulla: "Auta minua löytämään PPT projektin yhteenvedolla vuoden 2025 lopussa" "Etsi video, jossa minä ja äitini menimme Huangshaniin viime vuonna" Aika siistiä! Tässä on uusin SLM-versioni, joten jos olet kiinnostunut, keskustelkaa siitä yhdessä! Lisäksi Vibe-koodausryhmämme on toiminut pitkään, täytä vain lomake: