Upozorňování na špatné chování @_rexliu od @gen_analysis na LinkedIn - amatérská úprava obrázků pomocí umělé inteligence, aby ukradla příspěvek někoho jiného a přivlastnila si ho pro sebe Před dvěma dny vydali přátelé z @exolabs úžasný příspěvek s @nvidia + @Apple a pomocí obou hardwaru k urychlení LLM na zařízení. A pak jsem viděl příspěvek na LI od @_rexliu, který tvrdil, že "právě vyladili gpt-oss-120B (QLoRA 4-bit) na DGX Sparku..." (viz snímky obrazovky). Super známé nastavení, nápadně podobný stůl, nápadně podobná rostlina v pozadí, pozoruhodně podobné umístění kabelů. A žádné ID zařízení od NVIDIA pod nálepkou. (amatérská chyba) Ano.... Tihle kluci rozhodně viděli, jak se @alexocheema příspěvek na LI stal virálním, ukradli obrázek příspěvku a upravili ho umělou inteligencí, aby si mohli ukrást nezaslouženou chválu za spuštění těchto skvělých inovací. (A žádné kredity pro @exolabs) Tyto typy úprav obrázků pomocí umělé inteligence za účelem krádeže kreditu budou nyní stále snazší a běžnější. Buďte tam opatrní.
EXO Labs
EXO Labs16. 10. 2025
Clustering NVIDIA DGX Spark + M3 Ultra Mac Studio pro 4x rychlejší odvozování LLM. DGX Spark: 128GB @ 273GB/s, 100 TFLOPS (fp16), 3,999 $ M3 Ultra: 256 GB @ 819 GB/s, 26 TFLOPS (fp16), 5 599 $ DGX Spark má 3x menší šířku pásma paměti než M3 Ultra, ale 4x více FLOPS. Spuštěním výpočetně vázaného předvyplnění na DGX Sparku, dekódováním vázaným na paměť na M3 Ultra a streamováním KV cache přes 10GbE jsme schopni získat to nejlepší z obou hardwaru s masivním zrychlením. Krátké vysvětlení v tomto vlákně a odkaz na celý příspěvek na blogu níže.
@_rexliu @gen_analysis @exolabs @nvidia @Apple Dotyčný příspěvek:
35,59K