Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Fare prodotti AI, è davvero più importante "imparare facendo" 🥲🥲🥲
Ieri ho semplicemente condiviso un po' il mio strumento di gestione dei documenti AI, non mi aspettavo che così tante persone fossero interessate.
Inizialmente ho usato solo l'analisi del testo di Qwen 2.5 per la classificazione. Risultato: nella sezione commenti chiedevano: si può fare direttamente multimodale?
Poi ho discusso con Gemini e ChatGPT, e anche se si tratta di un piccolo modello locale, si può provare a fare multimodale, quindi ho aggiunto: BGE, CLIP, Whisper, Qwen, per un totale di 4 SLM, preparando di potenziare le funzioni di organizzazione e ricerca per file come "immagini", "video", "PDF".
😅 Oggi con Gemini abbiamo modificato la versione N, ed è ancora solo un prototipo. Ma pensare se potessimo cercare direttamente usando il linguaggio naturale:
"Aiutami a trovare quella presentazione PPT con il riepilogo del progetto di fine anno 2025"
"Trova il video che ho fatto con mia madre l'anno scorso a Huangshan"
Sarebbe davvero fantastico!
Qui sotto ci sono i miei ultimi tentativi con SLM, chi è interessato è benvenuto a discuterne! Inoltre, il nostro gruppo di coding Vibe è attivo a lungo termine, basta compilare il modulo:

Principali
Ranking
Preferiti
