Van chatbot naar digitale collega
De meeste ondernemers denken bij AI nog aan ChatGPT anno 2023: handig voor een e-mail, maar niet veel meer. Die perceptie is gevaarlijk verouderd.
De organisatie METR (Model Evaluation & Threat Research) houdt nauwkeurig bij hoe lang de taken zijn die AI-modellen zelfstandig kunnen voltooien. Hun bevinding is opzienbarend: de complexiteit van taken die AI betrouwbaar aankan, verdubbelt ongeveer elke zeven maanden. Dit patroon is consistent over de afgelopen zes jaar.
Concreet: in 2019 kon het beste AI-model taken van ongeveer vier seconden aan. In 2023 waren dat taken van enkele minuten. Begin 2025 ging het om taken van een half uur tot een uur. En nu, begin 2026, kan het nieuwste model taken van meer dan acht uur voltooien. Dat is een volledige werkdag.
Software-engineering: van 4% naar 81%
SWE-bench is de gouden standaard voor het meten van AI-prestaties op echte softwareproblemen. Het test modellen op complexe bugs uit populaire open-source projecten. Bij de lancering in oktober 2023 scoorde het beste model circa 4%. Begin 2026 staat de topscore op 80,9%.
Dit is geen geleidelijke verbetering. Dit is een paradigmaverschuiving. In twee jaar tijd is AI gegaan van "kan vrijwel niets" naar "lost de overgrote meerderheid van echte softwareproblemen op."
AI bedient nu uw computer
AI kan nu ook letterlijk uw computer bedienen: schermen bekijken, muisklikken uitvoeren, formulieren invullen, websites navigeren. De OSWorld-benchmark laat een vergelijkbare explosie zien.
Van 14,9% in oktober 2024 naar 72,5% in februari 2026. Dit opent de deur naar AI-agenten die niet alleen denken, maar ook handelen: administratie verwerken, systemen beheren, rapporten genereren. Zonder speciale koppelingen of integraties.
Wat betekent dit voor uw bedrijf?
Als de verdubbeling aanhoudt, praten we over twee tot vier jaar voordat AI taken van weken aankan. De vraag is niet of AI uw sector raakt, maar wanneer, en of u er klaar voor bent.
Klaar om te beginnen?
Ontdek wat AI kan betekenen voor uw bedrijf. Geen verplichtingen, wel een helder gesprek.
Start het Gesprek