1/ Annunciamo Open Dev Data, un dataset open source e un insieme di strumenti per misurare l'attività degli sviluppatori nel settore crypto e nel web decentralizzato. A partire dal 2025 ritireremo il nostro rapporto annuale per sviluppatori e lo sostituiremo con questa piattaforma continuamente aggiornata. 🧵👇
2/ Dal 2019, @electriccapital ha monitorato gli ecosistemi open source per comprendere dove i programmatori stanno costruendo. Le nostre pipeline ora seguono migliaia di ecosistemi, milioni di sviluppatori e centinaia di milioni di commit in tempo quasi reale.
3/ Questa piattaforma fornisce a protocolli, fondazioni, scienziati dei dati e analisti gli strumenti per comprendere il loro ecosistema di sviluppatori e raccontare la loro storia da un'unica fonte di verità.
4/ La piattaforma ha due prodotti: 1. La tassonomia dei repository open source 2. Le tabelle dei dati che mostrano i dati degli sviluppatori e dei commit per quei repository Continueremo a mantenere, supportato da questa piattaforma, per mostrare grafici e metriche.
5/ Tutto inizia con la tassonomia, una tassonomia curata dalla comunità degli ecosistemi e dei repository di crypto, privacy e web decentralizzato. Nel 2019 era un gruppo ristretto di manutentori interni. Oggi ha più di mille contributori.
6/ Su questa tassonomia gestiamo agenti AI che scandagliano il web, GitHub, GitLab e i social media per scoprire nuovi progetti. Gli esseri umani rimangono coinvolti per mantenere alta la qualità mentre l'automazione ci offre copertura e velocità.
7/ Dalla tassonomia eseguiamo pipeline di dati continue che calcolano metriche per ogni repo. Tutta la tecnologia in questa parte della piattaforma merita un post a sé un giorno. - Il fingerprinting evita il conteggio doppio. - La deduplicazione degli sviluppatori gestisce gli sviluppatori con più identità.
9/ Puoi scaricare comodamente il dataset da 40GB utilizzando il pacchetto python: open-dev-data.
10/ La licenza è semplice. Il codice nel repository open-dev-data è con licenza MIT. I dataset sono CC BY 4.0, quindi puoi usarli commercialmente purché tu dia la giusta attribuzione.
11/ Esempi di casi d'uso: - Confrontare gli ecosistemi in base all'attività degli sviluppatori nel tempo - Misurare l'impatto di sovvenzioni, hackathon o programmi di incentivazione - Riferimento incrociato delle implementazioni onchain del codice con l'attività sui loro repository git associati. - Molti altri...
13/ Segui @opendevdata per aggiornamenti, nuove funzionalità e progressi sulla piattaforma.
37,6K