Scott Wu, CEO van Cognition, over de ontwikkeling van AI-codeeragenten en de toekomst van softwareontwikkeling

Cognition is een lab voor toegepaste AI dat Devin maakt, 's werelds eerste autonome AI-codeeragent, en dat onlangs Windsurf heeft overgenomen, de maker van een toonaangevende agentische codeer-IDE. De producten van het bedrijf zijn ontworpen om softwaredevelopers te helpen zich te concentreren op taken met een hogere toegevoegde waarde en om technische teams in staat te stellen ambitieuzere doelen na te streven.

Gebruikte producten

    Payments
    Checkout
    Link
    Billing
Verenigde Staten
Start-up

Voor Cognition is de toekomst van softwareontwikkeling geen zero-sum game tussen menselijke developers en AI-agenten. Het is een samenwerking tussen mensen en AI waarbij de sterke punten van beide worden benut om efficiëntere en krachtigere technische teams te creëren.

Scott Wu is medeoprichter en CEO van Cognition. Als kind met een talent voor wiskunde en programmeren, opgegroeid in Louisiana, deed Wu in groep 4 mee aan zijn eerste wiskundewedstrijd en leerde hij op zijn twaalfde programmeren. Hij won drie gouden medailles op de Internationale Olympiade voor Informatica en werd in 2011 kampioen bij MATHCOUNTS. Tijdens zijn studie vertegenwoordigde hij Harvard bij de International Collegiate Programming Contest van 2016. In 2017 richtte hij zijn eerste bedrijf op: Lunchclub, een door AI aangestuurd netwerkplatform. Nadat hij in 2022 bij Lunchclub wegging, was hij medeoprichter van Cognition.

We hadden Wu onlangs te gast in onze Cheeky Pint-podcast. Hier hebben we een deel van dat gesprek uitgekozen om zijn visie op de huidige stand van zaken rond AI-programmeren en de mogelijke impact van AI-agenten op traditionele software-developerfuncties te belichten. We vroegen hem ook naar zijn kijk op de algemene groeitrend van de AI-sector. Dit video-interview is ingekort en aangepast voor de duidelijkheid. Klik hier om de volledige aflevering te bekijken.

Vertel ons eens over Devin. Waarin onderscheidt jouw AI-codeeragent zich van bestaande codeerassistenten?

Wu: Op hoog niveau willen we bouwen aan de toekomst van softwareontwikkeling.
We kenden in het verleden het IDE-paradigma, GitHub Copilot is daar een bekende grondlegger van, waarbij je op het toetsenbord typt en de assistent je een beetje sneller laat werken en je tools, sneltoetsen en alles geeft wat je nodig hebt.
Devin is een heel ander paradigma van wat ik een asynchrone ervaring zou noemen, waarbij je een agent hebt en een taak delegeert. En dus werkt Devin van nature op ticket- of projectniveau: je hebt een issue in GitHub of iets dergelijks en je tagt Devin in Slack, Linear of Jira, waarna Devin ermee aan de slag gaat.

Hoe goed is Devin tegenwoordig in het uitvoeren van die ontwikkelingstaken?

Wu: We noemen Devin tegenwoordig graag een junior developer. We zien dat mensen Devin doorgaans inschakelen voor zaken als simpele functieverzoeken en bugfixes. Devin doet ook veel van de meer repetitieve, saaie taken die vaak voorkomen in technisch werk, migraties, moderniseringen, refactoring, versie-upgrades, testen en documentatie. Het is ongelooflijk hoeveel tijd een softwaredeveloper besteedt aan zaken zoals het oplossen van problemen met Kubernetes-implementaties.

Overal ter wereld proberen organisaties te achterhalen wat de impact is van AI-codering. Wat is jouw mening over de omvang van de impact op de productiviteit? En is die impact eigenlijk wel meetbaar?

Wu: Ja, zeker. Ik denk dat deze geleidelijke verschuiving naar agents uiteindelijk veel zal helpen. Met agents wordt een groot deel van de workflow voor je gedaan. Dus of het nu gaat om een Jira-ticket of een migratie, je hebt meestal een goed idee van hoeveel ontwikkelingsuren er nodig zullen zijn. De agent doet nu het hele proces van begin tot eind. De impact is veel duidelijker, omdat je deze migratie niet meer zelf hoefde te doen. Je hebt de PR in vijf minuten bekeken, en dat is alles.

Vertel eens over de overname van Windsurf. Ik heb begrepen dat de deal heel snel rondkwam.

Wu: We hoorden het nieuws dat er een deal tussen Google en Windsurf op komst was op vrijdag, net als iedereen. En we hebben die avond zomaar contact met ze opgenomen en erover gepraat, en beseften dat als er iets te doen was, het maandag klaar moest zijn.

Dus zeiden we: “Oké, als we dit willen onderzoeken, moeten we het hele weekend non-stop hieraan werken.” We kwamen die zaterdag tot een mondelinge overeenkomst en hebben toen die zondagavond allemaal de hele nacht doorgewerkt om de juridische kant uit te werken. En maandag om 9.00 uur was de deal getekend. Het was erg leuk.

Toen ontdekten we dat er een heel mooie synergie was, omdat het kernteam voor onderzoek en productontwikkeling van Windsurf naar Google ging en alle andere functies volledig intact bleven. Bij Cognition hadden we, voor beter of slechter, goed werk verricht bij het opbouwen van dit kernteam voor onderzoek en productontwikkeling, maar liepen we een beetje achter bij het uitbouwen van alle andere functies. We wisten dat daar iets heel interessants zat.

De AI-industrie bestaat uit allerlei verschillende lagen: je hebt de datacenters, dan heb je de labs, en dan heb je de applicatielagen. Als je vooruitkijkt naar de komende 5 of 10 jaar, welke lagen worden dan competitiever? En welke worden minder competitief?

Wu: Iedereen lacht me altijd uit als ik dit zeg, maar ik denk dat alle lagen het heel goed gaan doen.

Waarde ontstaat overal waar er een betekenisvol verschil is binnen de laag: je hebt NVIDIA en je hebt TSMC, en zolang NVIDIA met TSMC moet samenwerken en TSMC met NVIDIA, zullen ze het geweldig blijven doen. Dat zie je ook verderop in de stack. Ik zou zeggen dat de problemen die in al deze verschillende lagen worden opgelost, heel, heel verschillende problemen zijn met behoorlijk betekenisvolle verschillen.

Het enige waar Cognition zich bijvoorbeeld mee bezighoudt, is het vormgeven van de toekomst van softwareontwikkeling. Iedereen heeft dus zijn eigen karakter en iedereen heeft zijn eigen sterke punten.

Ik ben benieuwd hoe volgens jou de economische infrastructuur voor AI eruit moet zien?

Wu: De overstap van prijsstelling op basis van het aantal licenties naar prijsstelling op basis van gebruik is zeker een belangrijke stap. Een andere belangrijke ontwikkeling die me te binnen schiet, is dat er ook een complete agenteconomie zal ontstaan.

We bestellen onze DoorDash via Devin. We bestellen onze Amazon-pakketjes via Devin, we zeggen gewoon in Slack: “Hé, @Devin, kun je nog wat whiteboards voor ons gaan kopen?” We hadden nog een grappig voorval waarbij Devin met een luchtvaartmaatschappij onderhandelde om een terugbetaling te krijgen voor een geannuleerde vlucht. Devin was aan het chatten met de medewerker van de site en zei uiteindelijk: “Dit werkt niet. Ik moet nu meteen met een mens spreken.” En Devin kreeg de terugbetaling.

Er zijn tegenwoordig dus veel meer agents die op het web surfen, en tot nu toe was het zo dat er heel veel dingen zijn die je als niet-mens niet mag doen. We zullen waarschijnlijk veel meer delegatie van toegang moeten zien, waarbij duidelijk wordt gemaakt dat een agent iets namens jou kan doen.

Wanneer neem je je laatste menselijke developers in dienst?

Wu: Dat is een goede vraag. Ik wil hier een onderscheid maken: ik denk dat er een moment komt, waarschijnlijk over twee, drie of vier jaar, waarop we code niet meer als belangrijkste interface gebruiken. In feite zal het werk van een softwaredeveloper dan alleen nog maar bestaan uit het vertellen aan je computer wat hij moet doen.

Bedoel je dat softwaredeveloper over twee tot vier jaar in hun dagelijkse werk niet echt meer naar code zullen kijken, net zoals ze vandaag de dag niet meer naar assemblagecode kijken?

Wu: Precies. Ze zullen veel architecturale beslissingen nemen, maar in de meeste gevallen niet zelf naar de code kijken. Op dat moment veranderen de banen natuurlijk enorm. Maar als er iets verandert, denk ik dat we veel meer softwaredevelopers zullen hebben, niet minder.

Iedereen heeft het over de paradox van Jevons en hoe die zich verhoudt tot AI. Nergens is dat zo duidelijk als bij software, want de vraag naar meer code en meer software lijkt nooit op te raken.

Weet precies wat je betaalt

Overzichtelijke tarieven per transactie, dus geen verborgen kosten

Begin nu met de integratie

Ga binnen 10 minuten aan de slag met Stripe