turingtest en ai 10 17

Pexels/Google Deepmind, CC BY-SA

In 1950 stelde de Britse computerwetenschapper Alan Turing een experimentele methode voor om de vraag te beantwoorden: kunnen machines denken? Hij suggereerde dat als een mens na vijf minuten ondervragen niet zou kunnen zeggen of hij tegen een kunstmatig intelligente (AI) machine of een ander mens sprak, dit zou aantonen dat AI mensachtige intelligentie heeft.

Hoewel AI-systemen tijdens zijn leven de Turing-test nog lang niet hebben doorstaan, speculeerde hij dat

“[…] over ongeveer vijftig jaar zal het mogelijk zijn om computers te programmeren […] zodat ze het imitatiespel zo goed kunnen spelen dat een gemiddelde ondervrager niet meer dan 70% kans heeft om na vijf minuten de juiste identificatie te maken. Ondervragen.

Tegenwoordig, meer dan zeventig jaar na het voorstel van Turing, is geen enkele AI erin geslaagd de test met succes te doorstaan ​​door te voldoen aan de specifieke voorwaarden die hij heeft geschetst. Niettemin, als enkele krantenkoppen reflecterenzijn een paar systemen behoorlijk dichtbij gekomen.

Eén recent experiment testte drie grote taalmodellen, waaronder GPT-4 (de AI-technologie achter ChatGPT). De deelnemers brachten twee minuten door met chatten met een andere persoon of een AI-systeem. De AI werd gevraagd kleine spelfouten te maken – en te stoppen als de tester te agressief werd.


innerlijk abonneren grafisch


Met deze aansporing heeft de AI de testers goed voor de gek gehouden. In combinatie met een AI-bot konden testers slechts 60% van de tijd correct raden of ze met een AI-systeem spraken.

Gezien de snelle vooruitgang die is geboekt bij het ontwerp van systemen voor natuurlijke taalverwerking, kunnen we zien dat AI binnen enkele jaren de oorspronkelijke test van Turing zal doorstaan.

Maar is het imiteren van mensen werkelijk een effectieve test voor intelligentie? En zo niet, wat zijn dan enkele alternatieve benchmarks die we zouden kunnen gebruiken om de mogelijkheden van AI te meten?

Beperkingen van de Turing-test

Terwijl een systeem dat de Turing-test doorstaat, ons dat geeft sommige bewijs dat hij intelligent is, is deze test geen doorslaggevende intelligentietest. Eén probleem is dat het ‘valse negatieven’ kan opleveren.

De huidige grote taalmodellen zijn vaak ontworpen om onmiddellijk te verklaren dat ze niet menselijk zijn. Wanneer u ChatGPT bijvoorbeeld een vraag stelt, wordt het antwoord vaak voorafgegaan door de zinsnede “als een AI-taalmodel”. Zelfs als AI-systemen het onderliggende vermogen hebben om de Turing-test te doorstaan, zou dit soort programmering dat vermogen terzijde schuiven.

De test riskeert ook bepaalde soorten “vals-positieve resultaten”. Zoals filosoof Ned Block wees erop in een artikel uit 1981 zou een systeem mogelijk de Turing-test kunnen doorstaan ​​door eenvoudigweg hardgecodeerd te zijn met een mensachtige reactie op elke mogelijke invoer.

Daarnaast richt de Turing-test zich vooral op de menselijke cognitie. Als AI-cognitie verschilt van menselijke cognitie, zal een deskundige ondervrager een taak kunnen vinden waarbij AI's en mensen qua prestaties verschillen.

Over dit probleem schreef Turing:

Dit bezwaar is zeer sterk, maar we kunnen in ieder geval zeggen dat als er toch een machine kan worden geconstrueerd die het imitatiespel op bevredigende wijze kan spelen, we ons door dit bezwaar niet hoeven te storen.

Met andere woorden: hoewel het slagen voor de Turing-test een goed bewijs is dat een systeem intelligent is, is het niet slagen voor de Turing-test geen goed bewijs dat een systeem intelligent is. niet intelligent.

Bovendien is de test geen goede maatstaf voor de vraag of AI’s bewust zijn, of ze pijn en plezier kunnen voelen, of een morele betekenis hebben. Volgens veel cognitieve wetenschappers omvat bewustzijn een bepaald cluster van mentale vermogens, waaronder het hebben van een werkgeheugen, gedachten van hogere orde en het vermogen om de eigen omgeving waar te nemen en te modelleren hoe het lichaam zich daarin beweegt.

De Turingtest geeft geen antwoord op de vraag of AI-systemen wel of niet bestaan deze capaciteiten hebben.

De groeiende mogelijkheden van AI

De Turing-test is gebaseerd op een bepaalde logica. Dat wil zeggen: mensen zijn intelligent, dus alles dat mensen effectief kan imiteren, is waarschijnlijk intelligent.

Maar dit idee vertelt ons niets over de aard van intelligentie. Een andere manier om de intelligentie van AI te meten, is door kritischer na te denken over wat intelligentie is.

Er bestaat momenteel geen enkele test die kunstmatige of menselijke intelligentie op gezaghebbende wijze kan meten.

Op het breedste niveau kunnen we intelligentie beschouwen als de vermogen om een ​​reeks doelen te bereiken in verschillende omgevingen. Intelligentere systemen zijn systemen die een breder scala aan doelen kunnen bereiken in een breder scala aan omgevingen.

Als zodanig is de beste manier om de vooruitgang in het ontwerp van AI-systemen voor algemene doeleinden bij te houden, het beoordelen van de prestaties ervan voor een verscheidenheid aan taken. Onderzoekers op het gebied van machine learning hebben een reeks benchmarks ontwikkeld die dit doen.

GPT-4 was dat bijvoorbeeld correct kunnen beantwoorden 86% van de vragen gaat over grootschalig multitask-taalbegrip – een benchmark die de prestaties meet op meerkeuzetoetsen in een reeks academische vakken op universitair niveau.

Ook daarin scoorde het gunstig AgentBench, een hulpmiddel dat het vermogen van een groot taalmodel kan meten om zich als agent te gedragen door bijvoorbeeld op internet te surfen, online producten te kopen en in games te concurreren.

Is de Turingtest nog relevant?

De Turing-test is een maatstaf voor imitatie – van het vermogen van AI om menselijk gedrag te simuleren. Grote taalmodellen zijn deskundige navolgers, wat nu tot uiting komt in hun potentieel om de Turing-test te doorstaan. Maar intelligentie is niet hetzelfde als imitatie.

Er zijn net zoveel soorten intelligentie als er doelen zijn die bereikt moeten worden. De beste manier om de intelligentie van AI te begrijpen, is door de voortgang bij de ontwikkeling van een reeks belangrijke capaciteiten te monitoren.

Tegelijkertijd is het belangrijk dat we niet steeds “de doelpalen veranderen” als het gaat om de vraag of AI intelligent is. Omdat de mogelijkheden van AI snel verbeteren, vinden critici van het idee van AI-intelligentie voortdurend nieuwe taken die AI-systemen misschien moeilijk kunnen voltooien – om er vervolgens achter te komen dat ze er overheen zijn gesprongen nog een hindernis.

In deze context is de relevante vraag niet of AI-systemen intelligent zijn, maar preciezer: wat soorten van de intelligentie die ze kunnen hebben.The Conversation

Simon Goldstein, Universitair hoofddocent, Dianoia Institute of Philosophy, Australian Catholic University, Australian Catholic University en Cameron Domenico Kirk-Giannini, Universitair Docent Filosofie, Rutgers University

Dit artikel is opnieuw gepubliceerd vanaf The Conversation onder een Creative Commons-licentie. Lees de originele artikel.