DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

TII, un laboratorio universitario di intelligenza artificiale con sede negli Emirati Arabi Uniti, ha rilasciato Falcon-H1R-7B, un piccolo modello di ragionamento con pesi aperti che si confronta bene con modelli di dimensioni simili 🧠 Punteggio di intelligenza forte tra i modelli <12B: Falcon-H1R-7B ottiene 16 nel nostro aggiornato Indice di Intelligenza Analitica Artificiale v4.0 - davanti a NVIDIA Nemotron Nano 12B V2, ma sotto Qwen3 VL 8B. Il modello è ben posizionato sulla frontiera di Pareto per Intelligenza vs Parametri Totali per modelli comparabili. Rispetto ad altri modelli <12B, Falcon-H1R-7B si comporta particolarmente bene in 3 valutazioni individuali - L'Ultimo Esame dell'Umanità (ragionamento e conoscenza), 𝜏²-Bench Telecom (uso di strumenti agentici) e IFBench (seguire istruzioni) 🇦🇪 Secondo partecipante della classifica degli Emirati: Dopo il K2-V2 di MBZUAI, Falcon-H1R-7B è il secondo modello di un'organizzazione con sede negli Emirati nella nostra classifica, tra un mare di modelli statunitensi e cinesi. Fondato dal governo di Abu Dhabi, il Technology Innovation Institute (TII) è un centro di ricerca globale la cui missione è spingere i confini della conoscenza ed è attivo in diversi settori, tra cui energia, tecnologia quantistica e crittografia. Hanno oltre 100 modelli e varianti con pesi aperti su Huggingface 📖 Modello moderatamente aperto: Falcon-H1R-7B ottiene 44 nell'Indice di Apertura dell'Analisi Artificiale - la nostra misura recentemente rilasciata, standardizzata e valutata in modo indipendente dell'apertura dei modelli di intelligenza artificiale in termini di disponibilità e trasparenza. Questo lo colloca davanti a gpt-oss-20B di OpenAI, ma dietro Qwen3 VL8B. I nostri modelli più aperti, di MBZUAI e Allen Institute for AI, si equivalgono nella classifica a 89, guidati da una maggiore trasparenza e accesso alla loro metodologia di addestramento e dati 📈 Token di output elevati: Il modello ha utilizzato 140M di token per completare il nostro Indice di Intelligenza. Questo lo colloca sotto GLM-4.7, ma sopra la maggior parte degli altri modelli - sia nella sua categoria di dimensioni che tra i modelli di frontiera 📘 Conoscenza attesa per le sue dimensioni, tasso di allucinazione moderato: AA-Omniscience è il nostro benchmark recentemente rilasciato che misura la conoscenza fattuale e l'allucinazione dei modelli. Falcon-H1R-7B riceve un punteggio moderato di -62. Il suo punteggio di accuratezza della conoscenza (14) è in linea con le aspettative, dato che vediamo una forte correlazione tra dimensione del modello e accuratezza (quanti fatti il modello ricorda correttamente). Il modello allucina l'87% delle volte quando non ricorda correttamente le risposte - un punteggio moderato tra i modelli di frontiera e i modelli con pesi aperti di piccole dimensioni Congratulazioni per il lancio @TIIuae !

Falcon-H1R-7B è il secondo modello di un'azienda con sede negli Emirati Arabi Uniti nelle nostre classifiche, tra un mare di modelli statunitensi e cinesi

Falcon-H1R-7B ha un punteggio moderato nell'Indice di Apertura dell'Analisi Artificiale

Il modello ha utilizzato 140 milioni di token per completare il nostro Indice di Intelligenza - al di sotto di GLM-4.7, ma superiore alla maggior parte degli altri modelli

Falcon-H1R-7B riceve un punteggio moderato in AA-Omniscience, con una conoscenza attesa per le sue dimensioni e un tasso di allucinazione moderato

Rispetto ai modelli comparabili, Falcon-H1R-7B si comporta bene in Humanity’s Last Exam (ragionamento e conoscenza), 𝜏²-Bench Telecom (uso di strumenti agentici) e IFBench (seguire istruzioni)

Ulteriore analisi su Artificial Analysis: Link di Hugging Face 🤗: Rapporto tecnico:

23,05K

Principali

Ranking

Preferiti