Anthropic lancerer Claude Opus 4.8 – med skarpere dømmekraft og ny teknologi til storskala opgaver

Bedre og mere ærlig

Opus 4.8 bygger videre på Opus 4.7 med forbedringer på tværs af en række benchmarks og er ifølge Anthropic en mere effektiv samarbejdspartner. anthropic

Et af de mest markante fremskridt handler om ærlighed. Tidlige testbrugere rapporterer, at Opus 4.8 er mere tilbøjelig til at markere usikkerheder i sit arbejde og sjældnere fremsætter påstande uden tilstrækkelig dokumentation. Evaluationer viser, at modellen er omkring fire gange mindre tilbøjelig end sin forgænger til at lade fejl i kode passere ubemærket. anthropic

Anthropics eget alignment-team konkluderede, at Opus 4.8 "når nye højder på målinger af prosociale egenskaber som at støtte brugerautonomi og handle i brugerens bedste interesse."

Nye funktioner følger med

Lanceringen ledsages af flere nye tiltag. Claude Code får en ny "dynamic workflows"-funktion, der giver modellen mulighed for at tackle meget store opgaver – herunder at planlægge arbejde og køre hundredvis af parallelle underagenter i én enkelt session, som efterfølgende verificerer outputtet, inden resultatet præsenteres for brugeren. Funktionen er tilgængelig i forskningsvisning for Enterprise-, Team- og Max-abonnementer.

Brugere på claude.ai får desuden nu kontrol over, hvor meget indsats Claude lægger i en given opgave – ved højere indstillinger tænker modellen mere og dybere, mens lavere indstillinger giver hurtigere svar og bruger færre ressourcer af brugerens rategrænse.

Derudover er "fast mode" til Opus 4.8 – hvor modellen kan arbejde 2,5 gange hurtigere – nu tre gange billigere end for tidligere modeller.

Roser fra erhvervslivet

Flere virksomheder, der har testet modellen på forhånd, er begejstrede. Michael Truell, medstifter og CEO hos Cursor, udtaler, at Opus 4.8 på CursorBench overgår tidligere Opus-modeller på alle indsatsniveauer, med en mere effektiv brug af værktøjer og færre trin for samme intelligens.

Inden for det juridiske område fremhæves det, at Opus 4.8 leverer den højeste score nogensinde registreret på Legal Agent Benchmark og er den første model til at bryde 10%-grænsen på all-pass-standarden.

Priser og fremtidsplaner

Prisen for Opus 4.8 er uændret i forhold til Opus 4.7: 5 dollar per million inputtokens og 25 dollar per million outputtokens. Fast mode koster henholdsvis 10 og 50 dollar per million tokens. Udviklere kan tilgå modellen via Claude API med modelbetegnelsen claude-opus-4-8.

Anthropic varsler allerede det næste skridt. Selskabet oplyser, at man arbejder på at frigive en ny modelklasse med endnu højere intelligens end Opus, og at en lille gruppe organisationer allerede anvender Claude Mythos Preview til cybersikkerhedsarbejde som del af Project Glasswing. Anthropic forventer at kunne tilbyde Mythos-klasse modeller til alle kunder inden for de kommende uger.

Anthropic lancerer Claude Opus 4.8 – med skarpere dømmekraft og ny teknologi til storskala opgaver

Kommentarer (0)