Van chatbot naar digitale collega

De meeste ondernemers denken bij AI nog aan ChatGPT anno 2023: handig voor een e-mail, maar niet veel meer. Die perceptie is gevaarlijk verouderd.

De organisatie METR (Model Evaluation & Threat Research) houdt nauwkeurig bij hoe lang de taken zijn die AI-modellen zelfstandig kunnen voltooien. Hun bevinding is opzienbarend: de complexiteit van taken die AI betrouwbaar aankan, verdubbelt ongeveer elke zeven maanden. Dit patroon is consistent over de afgelopen zes jaar.

Concreet: in 2019 kon het beste AI-model taken van ongeveer vier seconden aan. In 2023 waren dat taken van enkele minuten. Begin 2025 ging het om taken van een half uur tot een uur. En nu, begin 2026, kan het nieuwste model taken van meer dan acht uur voltooien. Dat is een volledige werkdag.

METR Time Horizon: taakduur die AI aankan groeit exponentieel
De taakduur die AI betrouwbaar aankan groeit exponentieel. Opus 4.6 is het eerste model dat een volledige werkdag (8+ uur) aankan. (Bron: METR Time Horizon 1.1)

Software-engineering: van 4% naar 81%

SWE-bench is de gouden standaard voor het meten van AI-prestaties op echte softwareproblemen. Het test modellen op complexe bugs uit populaire open-source projecten. Bij de lancering in oktober 2023 scoorde het beste model circa 4%. Begin 2026 staat de topscore op 80,9%.

SWE-bench Verified scores per releasedatum
SWE-bench Verified scores zijn geexplodeerd: van ~30% begin 2025 naar ruim 80% begin 2026. (Bron: Epoch AI / SWE-bench)

Dit is geen geleidelijke verbetering. Dit is een paradigmaverschuiving. In twee jaar tijd is AI gegaan van "kan vrijwel niets" naar "lost de overgrote meerderheid van echte softwareproblemen op."

AI bedient nu uw computer

AI kan nu ook letterlijk uw computer bedienen: schermen bekijken, muisklikken uitvoeren, formulieren invullen, websites navigeren. De OSWorld-benchmark laat een vergelijkbare explosie zien.

OSWorld Computer Use benchmark scores over tijd
Computer Use: van 14,9% (okt 2024) naar 72,5% (feb 2026). AI leert razendsnel om computers te bedienen als een mens. (Bron: OSWorld-Verified)

Van 14,9% in oktober 2024 naar 72,5% in februari 2026. Dit opent de deur naar AI-agenten die niet alleen denken, maar ook handelen: administratie verwerken, systemen beheren, rapporten genereren. Zonder speciale koppelingen of integraties.

Wat betekent dit voor uw bedrijf?

Als de verdubbeling aanhoudt, praten we over twee tot vier jaar voordat AI taken van weken aankan. De vraag is niet of AI uw sector raakt, maar wanneer, en of u er klaar voor bent.

Klaar om te beginnen?

Ontdek wat AI kan betekenen voor uw bedrijf. Geen verplichtingen, wel een helder gesprek.

Start het Gesprek
Paul Hoffman
Paul Hoffman
Oprichter Bytesize AI B.V. · AI Strateeg · 12+ jaar AI ervaring