Los modelos de lenguaje de proteínas acaban de recibir una actualización. Conozca Profluent-E1: un codificador de secuencia de proteínas de frontera gratuito, flexible y de frontera. E1 está construido con aumento de recuperación para aprender de múltiples secuencias. Modelos entrenados sobre tokens 4T con solo 150M-600M params, E1 es SOTA para tareas estructurales funcionales y no supervisadas de disparo cero. Eleva el listón para el aprendizaje de la representación de proteínas y está disponible gratuitamente en la actualidad.