Eine neue Ära für ChatGPT? GPT-4 könnte den berühmten Turing-Test bestanden haben

Die Forscher bewerteten die Fähigkeiten des GPT-4-Sprachmodells und kamen zu dem Schluss, dass es den Turing-Test bestanden hat.

Eine Gruppe von Forschern behauptet, dass GPT-4 den Turing-Test bestanden hat und es geschafft hat, menschliche Menschen zu täuschen.
Eine Gruppe von Forschern behauptet, dass GPT-4 den Turing-Test bestanden hat und es geschafft hat, menschliche Menschen zu täuschen.

Die Verwendung von Sprachmodellen, wie das berühmte ChatGPT, ist in der Gesellschaft zunehmend verbreitet und das Modell wird immer besser. Seit der Veröffentlichung von ChatGPT hat OpenAI bereits neue, aktualisierte Versionen getestet, die besser sind als die alten Versionen. Vor kurzem stellte das Unternehmen GPT-4 zur Verfügung, das im Vergleich zu anderen Versionen eine noch bessere Leistung aufweist.

Modelle sind so gut in Gesprächen und bei der Beantwortung von Fragen, dass sie oft den Eindruck erwecken können, dass wir mit einem anderen Menschen sprechen. Der Test, ob eine künstliche Intelligenz sich als Mensch ausgeben und andere Menschen täuschen kann, wird als Turing-Test bezeichnet. Der Test wurde von Alan Turing in seinem berühmten Aufsatz von 1950 über denkende Maschinen vorgeschlagen.

Eine neue Studie von Forschern der Universität von San Diego kommt zu dem Schluss, dass das Sprachmodell GPT-4 den Turing-Test besteht. Es wäre in der Lage, sich für einen Menschen auszugeben, um andere Menschen zu täuschen. Die Gruppe testete drei Sprachmodelle, darunter GPT-3, indem sie eine Gruppe von Personen 5 Minuten lang mit jedem Modell oder mit einer Person interagieren ließ, ohne diese zu kennen.

Artikel von 1950

Im Jahr 1950 veröffentlichte Alan Turing seinen berühmten Artikel Computing Machinery and Intelligence, der zu einem der wichtigsten Artikel in der Informatik wurde. Zu Beginn des Artikels stellt er die Frage, ob Maschinen denken können, und eröffnet damit eine Diskussion über mögliche künstliche Intelligenz. Dieser Artikel wird als einer der Ausgangspunkte für die Suche nach künstlicher Intelligenz angesehen.

In der Arbeit von 1950 bezeichnet Turing diese Maschinen, die das Gleiche wie Menschen tun würden, als denkende Maschinen.

Einer der wichtigsten Punkte des Artikels ist die Diskussion, die Turing über die Möglichkeit des Denkens einer Maschine führt. Der Artikel hat einen sehr tiefgründigen philosophischen Ansatz. Er macht vor allem durch die Diskussion darüber auf sich aufmerksam, wie Maschinen durch Muster lernen könnten. Lernen durch Muster ist heute die Grundlage des maschinellen Lernens.

Den Turing-Test durchführen

In dem Artikel wird auch ein Test vorgeschlagen, der als Turing-Test bekannt wurde. Die Idee hinter dem Test wäre es, herauszufinden, ob eine Maschine in der Lage wäre, sich für einen Menschen auszugeben und einen anderen zu täuschen. Einem Fragesteller sollte vorgegaukelt werden, dass er über Textnachrichten mit einem anderen Menschen spricht. Wenn die Maschine bei diesem Test erfolgreich war, könnte sie als intelligent gelten.

Alan Turings Artikel war revolutionär für das Gebiet der Informatik und enthält Konzepte, die auch heute noch wichtig sind.
Alan Turings Artikel war revolutionär für das Gebiet der Informatik und enthält Konzepte, die auch heute noch wichtig sind. Kredit: Hitoric Tech.

In den folgenden Jahrzehnten gewann der Test an Bedeutung, und es wurden mehrere Wettbewerbe ins Leben gerufen, bei denen Forscher und Unternehmen ihre Maschinen zum Testen einreichten. Eine der Anwendungen des Turing-Tests sind CAPTCHAs (Completely Automated Public Turing test to tell Computers and Humans Apart), die auf Websites verwendet werden, um mögliche Bots zu finden.

Sprachmodelle

Ein Sprachmodell ist ein Modell, das darauf trainiert wurde, Text zu verstehen, zu erstellen oder mit ihm zu interagieren. Das bekannteste Beispiel sind Modelle, die lernen, von einer Sprache in eine andere zu übersetzen. Die Idee ist, dass das Sprachmodell eine Eingabe erhält, die aus Text bestehen kann oder auch nicht, und eine Antwort in Form von Texten oder Sätzen liefert. Dieses Spezialgebiet wird als natürliche Sprachverarbeitung (NLP) bezeichnet.

Gegenwärtig sind die Sprachmodelle weit fortgeschritten und können eine Konversation aufrechterhalten, z. B. Fragen beantworten und Aufgaben wie das Zusammenfassen eines Textest durchführen. Die meisten dieser aktuellen Modelle basieren auf neuronalen Netzen und einer Technik namens Transformers. Sie werden mit einer großen Menge an Texten trainiert, wo sie Muster finden, Texte interpretieren und Aufgaben erfüllen können.

Welche Modelle bestehen den Test?

In Anbetracht der aktuellen Sprachmodelle schlug eine Gruppe von Forschern der Universität von San Diego vor, GPT-3.5 und GPT-4 dem Turing-Test zu unterziehen. Die Idee der Gruppe war es, Menschen dazu zu bringen, 5 Minuten lang per Text mit einer Person zu chatten. Bei diesen Personen konnte es sich um eine reale Person oder um ein Sprachmodell handeln, das getestet werden sollte.

In der Studie kamen sie zu dem Schluss, dass GPT-4 die Hälfte der Zeit die Menschen täuschen konnte. Um den Test zu bestätigen, setzte die Gruppe auch den Chatbot Eliza ein, der eine Leistung von etwa 22 % aufweist. Die Studie kommt also zu dem Schluss, dass GPT-4 den Turing-Test zwar bestanden hätte, Menschen aber immer noch in der Lage sind, andere Menschen in den meisten Fällen besser zu erkennen.

GPT-4

GPT-4 ist eine aktualisierte Version der Sprachmodelle, die ChatGPT antreiben. Diese Modelle wurden von der Firma OpenAI entwickelt und befinden sich in ihrer vierten Generation. von GPT-4 namens GPT-4o basieren würde. Einer der größten Unterschiede ist die Fähigkeit von GPT-4, längere, zusammenhängende Texte zu erstellen.

Darüber hinaus verfügt ChatGPT auch über eine Schnittstelle, die das Internet durchsuchen und aktuelle Fragen beantworten kann. Dies ist ein Fortschritt im Vergleich zu GPT-3, das bei seiner Einführung als eines der ersten in ChatGPT verwendet wurde, aber nur bis 2022 Informationen enthielt.

Quellenhinweise:

Jones & Bergen 2024 People cannot distinguish GPT-4 from a human in a Turing test arXiv.