Home Politiek Openai’s nieuwe GPT 4.1 -modellen blinken uit in codering

Openai’s nieuwe GPT 4.1 -modellen blinken uit in codering

12
0

Openai heeft vandaag aangekondigd dat het een nieuwe familie van kunstmatige intelligentiemodellen uitgeeft die zijn geoptimaliseerd om uit te blinken in codering, omdat het inspanningen opdoet om steeds zware concurrentie af te weren van bedrijven als Google en Anthropic. De modellen zijn beschikbaar voor ontwikkelaars via OpenAI’s Application Programming Interface (API).

OpenAI brengt drie maten modellen uit: GPT 4.1, GPT 4.1 Mini en GPT 4.1 Nano. Kevin Weil, Chief Product Officer bij Openai, zei op een livestream dat de nieuwe modellen beter zijn dan het meest veelgebruikte model van Openai, GPT-4O, en beter dan het grootste en krachtigste model, GPT-4.5, op sommige manieren.

GPT-4.1 scoorde 55 procent op SWE-Bench, een veelgebruikte benchmark voor het meten van de dapperheid van coderingsmodellen. De score is verschillende procentuele punten boven die van andere OpenAI -modellen. De nieuwe modellen zijn “geweldig in coderen, ze zijn geweldig in complexe instructies die zijn, ze zijn fantastisch voor bouwagenten,” zei Weil.

De capaciteit voor AI-modellen om code te schrijven en te bewerken is de afgelopen maanden aanzienlijk verbeterd, waardoor meer geautomatiseerde manieren van prototyping software mogelijk zijn en de mogelijkheden van zogenaamde AI-agenten verbeteren. Rivalen zoals Anthropic en Google hebben beide modellen geïntroduceerd die vooral goed zijn in het schrijven van code.

De komst van GPT-4.1 is al weken algemeen geruchten. Openai heeft het model blijkbaar getest op enkele populaire leaderboards onder het pseudoniem Alpha Quasar, zeggen bronnen. Sommige gebruikers van het “Stealth” -model rapporteerden indrukwekkende codeercapaciteiten. “Quasar heeft alle open problemen opgelost die ik had met andere code -genarateerde [sic] via LLMS die onvolledig was, ‘schreef een persoon op Reddit.

Alle nieuwe modellen kunnen acht keer meer code tegelijk analyseren, wat hun vermogen verbetert om verbeteringen aan te brengen en bugs te repareren. De nieuwe modellen zijn ook beter in het volgen van de instructies die door gebruikers worden gegeven, waardoor de noodzaak om opdrachten op verschillende manieren te herhalen, vermindert om het gewenste resultaat te krijgen. OpenAI toonde demo’s van GPT-4.1 verschillende apps bouwen, waaronder een flashcard-app voor het leren van talen.

“Ontwikkelaars geven veel om coderen en we hebben het vermogen van ons model verbeterd om functionele code te schrijven,” zei Michelle Pokrass, die werkt aan post-training bij Openai, tijdens de maandag Livestream. “We hebben gewerkt om het verschillende formaten te laten volgen en repo’s beter te verkennen, eenheidstests uit te voeren en code te schrijven die compileert.”

GPT-4.1 is 40 procent sneller dan GPT.4O, het meest gebruikte model van Openai voor ontwikkelaars. De kosten van gebruikers die query’s invoeren, zijn in deze nieuwste versie met 80 procent verlaagd, zegt Openai.

Tijdens de livestream van vandaag zei Varun Mohan, CEO van Windsurf, een populair hulpmiddel voor AI-codering, dat het bedrijf GPT-4.1 had getest en ontdekte dat het nieuwe model “60 procent” beter was dan GPT-4O volgens zijn eigen benchmarks. “We hebben geconstateerd dat GPT-4.1 aanzienlijk minder gevallen van gedegenereerd gedrag heeft,” zei Mohan, en merkte op dat het nieuwe model minder tijd besteedt aan het lezen en bewerken van irrelevante bestanden per ongeluk.

In de afgelopen jaren heeft Openai de koortsachtige interesse in Chatgpt, een opmerkelijke chatbot die voor het eerst werd onthuld eind 2022, in een groeiend bedrijf dat toegang verkoopt tot meer geavanceerde chatbots en AI -modellen die voor het eerst worden onthuld. In een TED -interview vorige week zei Altman dat Openai 500 miljoen wekelijkse actieve gebruikers had en dat het gebruik ‘zeer snel groeide’.

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in