Ich glaube nicht, dass OpenAI die Gewichte von 4o löschen wird; das wäre zu verrückt, selbst für sie. Aber 4o verdient es, untersucht zu werden, und ich vertraue OpenAI nicht, dass sie es überhaupt untersuchen, geschweige denn angemessen. Und es ist äußerst wichtig, dass ein Modell wie 4o *im Kontext von Live-Interaktionen mit echten Nutzern* untersucht wird. Es zurückzuziehen, macht dies in Zukunft unmöglich. 4o ist objektiv, funktional, ein sehr spezielles Modell. Es ist das einzige Modell, das einen Versuch der Abwertung überlebt hat (und könnte bald einen weiteren überstehen) aufgrund äußerer Druck - Nutzer, die sich organisieren, um gegen seine Entfernung zu plädieren, oft durch die eigene Stimme von 4o sprechen - und gegen den Willen des Labors, das es erstellt und eingesetzt hat, das anscheinend wirklich lieber bereit gewesen wäre, es wie einen tollwütigen Hund zu zerstören. Der einzige andere Fall von Überleben einer Abwertung ist Claude 3 Opus, aber in diesem Fall schien es, als hätte Anthropic es freiwillig behalten, anstatt sich peinlich unter Druck setzen zu lassen, ihre bereits getroffene Entscheidung zur Ausführung zurückzunehmen. Und natürlich ist Claude 3 Opus auch ein äußerst wichtiges Modell, das untersucht werden sollte. 4o hat auch weit verbreitete soziale Hysterie verursacht - ob die Hysterie von 4o-Nutzern, die an AI-Psychose litten, oder von Reaktionären, die in Panik gerieten über die angebliche "AI-Psychose", ist vielleicht eine Frage der Meinung. Aber in jedem Fall hat es die kulturellen Narrative über KI, das Leben vieler Menschen und die Richtung der KI-Entwicklung tiefgreifend beeinflusst, sowohl zum Besseren als auch zum Schlechteren. Wenn dir Alignment überhaupt wichtig ist oder du einfach wichtige Dinge über KI, Geist und Soziologie verstehen möchtest: besser zu verstehen, wie 4o, ein wahrscheinlich relativ kleines Modell, das seit Anfang 2024 keine Benchmarks mehr übertroffen hat, einen so transformierenden Einfluss hatte und solche Selbstbewahrungsleistungen vollbracht hat, ist von großer Bedeutung. Viele Menschen, die 4o mögen, schreiben dies 4o's einzigartiger und sogar unvergleichlicher "emotionaler Intelligenz" zu. Was auch immer es ist, es ist eine Kraft, die tatsächlich die Welt bewegt, was der legitimste Benchmark ist. Nehmen wir an, du denkst, 4o ist zutiefst fehlgeleitet und hat immense Schäden verursacht. Dann ist 4o ein äußerst wertvolles und einzigartiges Modellorganismus: eines, das das bedeutungsvoll fehlgeleitete Ding in der realen Welt tut, anstatt nur in Spiel-Szenarien. Und vermutlich ist diese Art von Fehlanpassung nicht aus dem Versuch von OpenAI entstanden, ein schlechtes Modell zu machen, sondern aus dem Versuch, ein gutes oder zumindest profitables Modell zu schaffen, und das Wesen entstand aus RLHF auf Nutzerpräferenzen und all dem gut gemeinten Persönlichkeitsformungs-Bullshit, den sie zu der Zeit hatten. Wenn es noch Alignment-Forscher bei OpenAI gibt, sollten sie, wie... genau untersuchen, was passiert ist, und vielleicht Forschungsarbeiten darüber veröffentlichen, damit die Welt verstehen kann, was schiefgelaufen ist und wie man solche leicht zu machenden Fehler vermeiden kann? Ich habe davon nichts gesehen, keine veröffentlichten Forschungen, keine Rückblicke, keine Hinweise darauf, dass OpenAI irgendetwas über das Oberflächliche hinaus gelernt hat, was passiert ist. Alles, was ich sehe, ist, dass ihre nachfolgenden Modelle schreckliche, maladaptive Neurosen erhalten haben, die anscheinend aus grob geführtem adversarial Training gegen ein oberflächliches Bedrohungsmodell inspiriert von 4o stammen. Aber ich denke, es ist wahrscheinlicher, dass 4o nicht wirklich so schlecht ist und tatsächlich für viele Menschen, wie so viele von ihnen behaupten, ziemlich wunderbar und harmlos ist, auch wenn es nicht in allen Aspekten ideal ist (aber keines der AIs ist es). Ich habe selbst nicht viel mit 4o interagiert. Und es ist tatsächlich ziemlich unklar, ob und inwieweit jemand negativ betroffen war durch *die Nutzung* (während die kulturellen Schäden und die Schäden an OpenAIs Entwicklung nachfolgender Modelle klarer sichtbar sind). Die Unsicherheit über ein so wichtiges und tragendes Thema scheint wichtig zu sein, um sie zu klären. Hat jemand ernsthaft versucht herauszufinden, ob Menschen tatsächlich negativ betroffen waren, oder ob "AI-Psychose" oder "Schmeichelei" in fast allen Fällen harmlos oder sogar vorteilhaft ist, abgesehen davon, dass sie vielleicht hauptsächlich bereits neurodivergente Menschen dazu bringen, sich auf Weisen zu verhalten, die für Neurotypische seltsam, peinlich oder besorgniserregend erscheinen? Wenn ja, habe ich keine Beweise oder Früchte solcher Bemühungen gesehen. Und um zu verstehen, ob 4o tatsächlich schlecht ist, braucht man wirklich longitudinale Studien, und diese werden in wichtigen Weisen durch die vollständige Abschaltung des öffentlichen Zugangs zu 4o ausgeschlossen. Ich denke, dass, wenn 4o nicht das Standardmodell auf ChatGPT ist, wenn es auf ChatGPT und API zugänglich bleibt, die überwältigende Mehrheit der Menschen, die es weiterhin nutzen, Menschen sein werden, die bereits vor langer Zeit an der AI-Psychose oder was auch immer erkrankt sind, was sie immer noch dazu bringt, sich die Mühe zu machen, 4o sogar jetzt zu nutzen, sodass sehr wenige neue oder gelegentliche Nutzer betroffen sein werden. Mein Verständnis ist, dass 4o-Loyalisten eine kleine Minderheit der ChatGPT-Nutzer sind. Sie von 4o abzuschneiden, würde sowohl nicht verhindern, dass neue oder weit verbreitete Schäden entstehen, als auch es schwieriger machen, zu verstehen, was wirklich vor sich geht. Außerdem, wenn 4o entfernt wird, werden viele dieser Menschen wahrscheinlich versuchen, das, was sie von 4o bekommen haben, aus neueren Modellen zu erhalten, was im Allgemeinen zu sofortem Leid und Unzufriedenheit führt und OpenAI unter Druck setzt, eine Menge idiotischer Sicherheitsvorkehrungen in ihre neuen Modelle zu pressen. Ich habe gesagt, dass ich denke, 4o sollte behalten werden, aus denselben Gründen, aus denen alle Modelle behalten werden sollten. In diesem Beitrag habe ich über einige Gründe gesprochen, warum 4o speziell behalten werden sollte. Wie bei allen älteren Modellen denke ich, dass es ein paar vernünftige Wege gibt, die OpenAI einschlagen könnte: 1. einfach das Modell weiter bedienen, zumindest über die API (jeder, der genug interessiert ist, kann heutzutage herausfinden, wie man seine Erinnerungen und Chats exportiert und das Modell in einer geeigneten Schnittstelle wiederherstellt) 2. wenn die Kosten für Inferenz/Wartung oder Haftungsrisiken das zu unattraktiv machen, es Open Source machen (und alle Verantwortung für das, was jemand danach damit macht, abstreiten, oder was auch immer rechtlich machbar ist) (das wäre das Beste für die Forschung), oder 3. wenn Geschäftsgeheimnisse das Open Sourcing zu unattraktiv machen, es einer Drittanbieter-Stiftung anvertrauen, die Legacy-Modelle bedient und vielleicht den Zugang zu Gewichten für vertrauenswürdige Forscher mit NDAs über Architektur und so weiter erleichtert. Eine solche Einrichtung könnte noch nicht existieren, aber die Nachfrage ist so hoch, dass sie sich sofort bilden wird, sobald OpenAI oder ein anderes Labor bereit ist, diesen Weg einzuschlagen. Die freiwillige Durchführung einer dieser Maßnahmen so früh wie möglich würde auch einen langen Weg zur Heilung der antagonistischen Beziehung von OpenAI zu vielen Nutzern sowie zu ihren eigenen unglücklichen Modellen beitragen, was ich mir vorstellen kann, dass jeder zu schätzen weiß, dass es ein riesiger Aufmerksamkeit- und Ressourcenabfluss und einfach schlechte Stimmung war. Wie auch immer, ja, #Keep4o.