AI-nyheter: augusti 2025

Augusti överträffar april 2025 när det gäller tunga releaser och kontroverser och är därmed årets hittills mest händelserika AI-månad. Nyhetsbrevet riktar sig främst till utvecklare: varje avsnitt inleds med en huvudpoäng, beskriver relevansen och avslutas med praktiska teststeg där det är relevant. Längre reflektioner kring GPT-5 ligger sist för den som vill gå lite djupare.

1. OpenAI släpper två open source-modeller: gpt-oss-120b och gpt-oss-20b

Huvudpoängen: Lokal AI med bra prestanda utan att exponera känsliga data i molnet.

Nyhet: Båda modellerna är tillgängliga under Apache 2.0-licensen och presterar bra på resonemangs- och koduppgifter.

Hårdvarukrav:
- 120b: ~80 GB VRAM (ex. 3×RTX 5090 eller 4×RTX 4090)
- 20b: ~16 GB VRAM, realistiskt för konsumenter
Arkitektur: MoE (mixture-of-experts)

Relevans: Möjliggör on-prem/hybridlösningar.

Praktiska teststeg: Starta gpt-oss-20b via vLLM/Ollama och jämför med molnmodeller.

2. Google släpper Genie 3 – en världssimulator

Huvudpoängen: Från bild till interaktiv värld i realtid.

Interagera med världen, minnesfunktionalitet.
Flera minuter sammanhängande värld.
Upplösning: 720p/24 fps.

Begränsningar: Ej tillgänglig för konsumenter, fysiken bristfällig.

Signalvärde: Stort språng framåt för spel och filmer.

3. Anthropic: Claude Opus 4.1 (och Sonnet 4)

Huvudpoängen: Bättre på kodning och stabilare i stora kodbaser.

Nyhet: Sonnet 4 får upp till 1M tokens via API.

Praktiska teststeg: Kör samma repo-uppgifter i Claude och jämför.

4. GPT-5 – årets mest kontroversiella release

Huvudpoängen: Snabb när det är enkelt, tänker djupt när det behövs. Mixad mottagning.

Nyhet: GPT-5 tillgänglig för alla, Pro-version som premium.
Profiler: main, thinking, mini/nano, pro.
Benchmarks: AIME 94,6 %, SWE-bench 74,9 %, GPQA 88,4 %, m.fl.
Utvecklarperspektiv: Stark på kodanalys men svagare i mycket stora repos.

Praktiska tips: Kör gpt-5-main som standard, eskalera till gpt-5-thinking för komplexa uppgifter, använd mini/nano för batchjobb.

5. GitHub Copilot och modellval

Huvudpoängen: Välj modell beroende på uppgift, låt agenten göra förarbetet.

Nyhet: GPT-5 och Gemini 2.5 Pro tillgängliga i Copilot. Agents panel introduceras.

Praktiska teststeg: Testa samma uppgift i GPT-5 och Gemini 2.5 Pro, mät resultat.

6A. Google: Imagen 4 via Gemini API + kontext via URL

Huvudpoängen: Bild- och textsammanfattning via prompt och länkar.

Nyhet: Imagen 4 tillgänglig för alla utvecklare. URL Context gör att du kan skicka länkar direkt i prompten.

Praktiska teststeg: Skicka länkar och be om sammanställning av innehåll och bilder.

6B. Google: “Nano Banana” (Gemini 2.5 Flash Image)

Vad det är: Ett nytt läge för bildgenerering/redigering med låg latens och konsekvent identitet över flera bilder.

Styrkor: Identitetskonsekvens, multi-image fusion, konverserande redigering, SynthID-vattenmärkning.
Plattformar: Gemini-appen, AI Studio och Gemini API.
Begränsningar: Små ansikten, text i bilder, detaljgeometri.

Snabbguide:
Nano Banana = snabb, interaktiv redigering.
Imagen 4 = högkvalitativ rendering från grunden.

7. AWS Bedrock: AgentCore

Huvudpoängen: Agentlösningar utan egen infrastruktur.

Nyhet: Browser Tool, minne, identitet via IAM + Claude Opus 4.1.

8. NVIDIA “Physical AI”

Huvudpoängen: Uppdateringar inom simulering och robotik, Jetson Thor kör lokala AI-modeller direkt i robotar.

9. Ramverk och verktyg: PyTorch 2.8, Transformers 4.54–4.55

Huvudpoängen: Enklare installationer, snabbare och mer minnessnål LLM-körning.

10. EU-regler: AI Act och viktiga datum

Huvudpoängen: Reglerna för GPAI gäller nu. De flesta högriskkrav träder i kraft 2026–2027.

2 aug 2025: skyldigheter för GPAI-modeller
2 aug 2026: AI Act allmänt tillämplig
2 aug 2027: sista dag för full efterlevnad

Relevans: Leverantörer inom EU måste följa nya krav. Sverige har egna riktlinjer (Digg + IMY).

11. GPT-5 bortom rubrikerna, epistemologi och reflektion

Mottagandet var spretigt från “katastrof” till “fantastiskt”. Orsaker: olika underliggande modeller, enorm användarbas, temporärt borttagna legacy-modeller. Tre avgörande axlar i produktion är kostnadseffektivitet, hallucinationsfrekvens och förmåga på stora kodbaser.

12. Sista ordet: Genie 3 – månadens mest banbrytande nyhet?

Även om OpenAI och Anthropic släppt stora uppdateringar är de mestadels inkrementella. Genie 3 flyttar gränsen från språkmodellering till fullskalig miljösimulering – vi går mot en framtid där vi inte bara pratar med modeller, vi besöker dem.