我們推出了 Project AELLA,與 @laion_ai 和 @wyndlabs_ai 合作 AELLA 是一個開放科學倡議,旨在通過 LLMs 創建的結構化摘要使科學研究變得可及 現在可用: - 100K 摘要數據集 - 2 個微調的 LLM - 3D 可視化工具 👇
部落格: 模型: 可視化工具: 這個項目涵蓋了許多學科: - 定制模型訓練管道 - 高通量推理系統 - 確保計算完整性的協議 以及更多。 我們的目標是處理超過 1 億篇研究論文並公開釋放完整數據集。
@laion_ai @Wyndlabs_ai @AmarSVS @0xdrej @bonham_sol @francescodvirga @ChristophSchuh6 @inference_net 為了完成這個項目,我們訓練了 2 個自定義模型:Aella-Nemotron-12b 和 Aella-Qwen-14b。 今天在 @huggingface 上可用。 這些模型在我們的提取任務中以 98% 的更低成本達到了前沿性能。
@laion_ai @Wyndlabs_ai @AmarSVS @0xdrej @bonham_sol @francescodvirga @ChristophSchuh6 @inference_net @huggingface 這個項目能夠實現,離不開許多專注且才華橫溢的研究人員、工程師和技術專家的貢獻: - @AmarSVS - @francescodvirga, - @bonham_sol - @ChristophSchuh6 - @laion_ai - @0xdrej - @grass 以及更多其他人。
59.91K