1/ Anunciar Open Dev Data, un conjunto de datos y pila de herramientas de código abierto para medir la actividad de los desarrolladores en cripto y la web descentralizada. A partir de 2025 retiraremos nuestro Informe Anual de Desarrolladores independiente y lo reemplazaremos por esta plataforma que se actualiza continuamente. 🧵👇
2/ Desde 2019 @electriccapital ha seguido ecosistemas de código abierto para entender dónde están construyendo los desarrolladores. Nuestros pipelines ahora siguen miles de ecosistemas, millones de desarrolladores y cientos de millones de commits en tiempo casi real.
3/ Esta plataforma ofrece a protocolos, fundamentos, científicos de datos y analistas las herramientas para entender su ecosistema de desarrolladores y contar su historia desde una única fuente de verdad.
4/ La plataforma tiene dos productos: 1. La taxonomía de los repositorios de código abierto 2. Las tablas de datos que muestran los datos de desarrollador y de commit para esos repositorios Seguiremos manteniendo, impulsados por esta plataforma, para mostrar gráficos y métricas.
5/ Todo comienza con la taxonomía, una taxonomía seleccionada por la comunidad sobre ecosistemas y repositorios web criptográficos, de privacidad y descentralizados. En 2019 eran unos pocos mantenedores internos. Hoy en día cuenta con más de mil colaboradores.
6/ Además de esta taxonomía, ejecutamos agentes de IA que escanean la web, GitHub, GitLab y las redes sociales para descubrir nuevos proyectos. Los humanos se mantienen informados para mantener la calidad alta mientras la automatización nos da cobertura y velocidad.
7/ A partir de la taxonomía ejecutamos pipelines de datos continuos que calculan métricas para cada repositorio. Toda la tecnología de esta parte de la plataforma merece su propia publicación algún día. - La toma de huellas dactilares evita el doble recuento. - La deduplicación por desarrolladores se encarga de desarrolladores multiidentidad.
9/ Puedes descargar cómodamente el conjunto de datos de 40GB usando el paquete de python: open-dev-data.
10 / Licencias es sencillo. El código en el repositorio de datos de desarrollo abierto está licenciado por MIT. Los conjuntos de datos son CC BY 4.0, así que puedes usarlos comercialmente siempre que des la atribución adecuada.
11/ Ejemplos de casos de uso: - Comparar ecosistemas por actividad de desarrollo a lo largo del tiempo - Medir el impacto de subvenciones, hackathones o programas de incentivos - Cruzar despliegues onchain de código con actividad en sus repositorios git asociados. - Muchos más...
13/ Sigue @opendevdata para actualizaciones, nuevas funciones y avances en la plataforma.
37.59K