Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Taelin
Soort / Bocht / HVM / INets / λCalculus
ja, geen enkel model ter wereld komt in de buurt van dit
ik ga slapen, 100% zeker dat ik gelijk heb in mijn oordeel
zoals altijd, dit zal snel gezond verstand zijn, maar ik zei het eerst (:
tot ziens

Taelin37 minuten geleden
Oh, ik heb net opgemerkt dat de oplossing van GPT-5 identiek is aan die van mij
Dit is ongelooflijk
2,64K
Nee, jullie hebben allemaal ongelijk, GPT-5 is een sprongetje
Ik zet hier 100% in
Ik wilde niet te snel posten en er weer spijt van krijgen, maar het heeft zojuist een aantal zeer, zeer moeilijke debugging prompts opgelost die eerder onoplosbaar waren (door AI), en vervolgens een prachtige pixelachtige Gameboy-game ontworpen met een niveau van detail en kwaliteit dat duidelijk verder gaat dan alles wat ik ooit heb gezien.
Er is geen manier dat dit model slecht is.
Ik denk dat jullie allemaal getraumatiseerd zijn door benchmaxxers, en overcompensatie tegen een model dat eigenlijk goed is. Ik denk ook dat jullie de sterke punten van gpt-oss onderschatten (maar ja, mijn laatste post was gehaast)
Ik weet nog steeds niet of het bruikbaar is voor serieuze programmering (o3 was dat niet), maar het lijkt zo? Een coderingsmodel dat net zo betrouwbaar is als Opus, maar slimmer dan o3, zou mijn workflow volledig veranderen. Opus heeft geen nadenken nodig om geweldig te zijn, dus dat zou in zijn voordeel kunnen wegen.
Voor wat het waard is, heb ik eigenlijk maar 3 modellen gebruikt:
- Opus 4.1 voor coderen
- Gemini 2.5 heel zelden voor coderen wanneer Opus faalt
- o3 voor alles behalve coderen
22,82K
Nee, jullie hebben allemaal ongelijk, GPT-5 is een sprongetje
Ik zet hier 100% in
Ik wilde niet te snel posten en er spijt van krijgen, maar het heeft zojuist een heleboel zeer, zeer moeilijke debugging prompts opgelost die eerder niet opgelost waren (door AI), en vervolgens een prachtige pixelachtige Gameboy-game ontworpen met een niveau van detail en kwaliteit dat duidelijk verder gaat dan alles wat ik ooit heb gezien.
Er is geen manier dat dit model slecht is.
Ik denk dat jullie allemaal getraumatiseerd zijn door benchmaxxers, en overcompensatie tegen een model dat eigenlijk echt goed is. Ik denk ook dat jullie de sterke punten van gpt-oss onderschatten (maar ja, mijn laatste post was gehaast)
Ik weet nog steeds niet of het bruikbaar is voor serieuze programmering, hoewel (4o, o3 waren dat zeker niet), maar het lijkt zo? Een coderingsmodel dat net zo betrouwbaar is als Opus, maar slimmer dan o3, zou mijn workflow volledig veranderen. Opus heeft geen nadenken nodig om geweldig te zijn, dus dat zou in zijn voordeel kunnen wegen.
Voor wat het waard is, heb ik eigenlijk maar 3 modellen gebruikt:
- Opus 4.1 voor coderen
- Gemini 2.5 heel zelden voor coderen wanneer Opus faalt
- o3 voor alles behalve coderen
461
"de dood voorkomen is zeer onethisch"

João Pedro de Magalhães6 aug, 06:41
"Het is zeer onethisch om veroudering te stoppen" - beoordelaar die commentaar geeft op een van mijn subsidieaanvragen.
De subsidie was gericht op cellulaire verjonging, er werd geen melding gemaakt van het genezen van veroudering, maar het toont aan dat we nog een lange weg te gaan hebben om zelfs medewetenschappers ervan te overtuigen dat het genezen van veroudering wenselijk is.
16,06K
het voorkomen van de dood is zeer onethisch

João Pedro de Magalhães6 aug, 06:41
"Het is zeer onethisch om veroudering te stoppen" - beoordelaar die commentaar geeft op een van mijn subsidieaanvragen.
De subsidie was gericht op cellulaire verjonging, er werd geen melding gemaakt van het genezen van veroudering, maar het toont aan dat we nog een lange weg te gaan hebben om zelfs medewetenschappers ervan te overtuigen dat het genezen van veroudering wenselijk is.
233
Dus gpt-oss 120B kan geen correct Duits produceren, maar pakt complexe Haskell-bugs aan die zelfs Opus niet kon identificeren?
Hoe gebeurt dat?
Ik ben oprecht zo in de war door dit alles.

Björn Plüster6 aug, 04:45
gpt-oss 120B is zeer duidelijk niet in staat om linguïstisch correct Duits tekst te produceren. 🧵
236
Mijn eerste indruk van het OSS-model van OpenAI komt overeen met wat ze adverteerden. Het voelt dichter bij o3 dan bij andere open modellen, behalve dat het veel sneller en goedkoper is. Sommige aanbieders bieden het aan met 3000 tokens/s, wat insane is. Het is zeker slimmer dan Kimi K2, R1 en Qwen 3. Ik heb alle modellen even getest en kreeg zeer beslissende resultaten in het voordeel van OpenAI-OSS-120b.
Helaas is er één ding dat deze modellen nog niet kunnen - mijn verdomde baan. Dus, ik hoop dat jullie plezier hebben. Ik ben terug om de superposed λ-calculus evaluatie te debuggen 😭 tot ziens.
410,37K
Boven
Positie
Favorieten
Populair op onchain
Populair op X
Recente topfinanciering
Belangrijkste