Augusti överträffar april 2025 när det gäller tunga releaser och kontroverser och är därmed årets hittills mest händelserika AI-månad. Nyhetsbrevet riktar sig främst till utvecklare: varje avsnitt inleds med en huvudpoäng, beskriver relevansen och avslutas med praktiska teststeg där det är relevant. Längre reflektioner kring GPT-5 ligger sist för den som vill gå lite djupare.
1. OpenAI släpper två open source-modeller: gpt-oss-120b och gpt-oss-20b
Huvudpoängen: Lokal AI med bra prestanda utan att exponera känsliga data i molnet.
Nyhet: Båda modellerna är tillgängliga under Apache 2.0-licensen och presterar bra på resonemangs- och koduppgifter.
- Hårdvarukrav:
- 120b: ~80 GB VRAM (ex. 3×RTX 5090 eller 4×RTX 4090)
- 20b: ~16 GB VRAM, realistiskt för konsumenter
- Arkitektur: MoE (mixture-of-experts)
Relevans: Möjliggör on-prem/hybridlösningar.
Praktiska teststeg: Starta gpt-oss-20b via vLLM/Ollama och jämför med molnmodeller.
2. Google släpper Genie 3 – en världssimulator
Huvudpoängen: Från bild till interaktiv värld i realtid.
- Interagera med världen, minnesfunktionalitet.
- Flera minuter sammanhängande värld.
- Upplösning: 720p/24 fps.
Begränsningar: Ej tillgänglig för konsumenter, fysiken bristfällig.
Signalvärde: Stort språng framåt för spel och filmer.
3. Anthropic: Claude Opus 4.1 (och Sonnet 4)
Huvudpoängen: Bättre på kodning och stabilare i stora kodbaser.
Nyhet: Sonnet 4 får upp till 1M tokens via API.
Praktiska teststeg: Kör samma repo-uppgifter i Claude och jämför.
4. GPT-5 – årets mest kontroversiella release
Huvudpoängen: Snabb när det är enkelt, tänker djupt när det behövs. Mixad mottagning.
- Nyhet: GPT-5 tillgänglig för alla, Pro-version som premium.
- Profiler: main, thinking, mini/nano, pro.
- Benchmarks: AIME 94,6 %, SWE-bench 74,9 %, GPQA 88,4 %, m.fl.
- Utvecklarperspektiv: Stark på kodanalys men svagare i mycket stora repos.
Praktiska tips: Kör gpt-5-main som standard, eskalera till gpt-5-thinking för komplexa uppgifter, använd mini/nano för batchjobb.
5. GitHub Copilot och modellval
Huvudpoängen: Välj modell beroende på uppgift, låt agenten göra förarbetet.
Nyhet: GPT-5 och Gemini 2.5 Pro tillgängliga i Copilot. Agents panel introduceras.
Praktiska teststeg: Testa samma uppgift i GPT-5 och Gemini 2.5 Pro, mät resultat.
6A. Google: Imagen 4 via Gemini API + kontext via URL
Huvudpoängen: Bild- och textsammanfattning via prompt och länkar.
Nyhet: Imagen 4 tillgänglig för alla utvecklare. URL Context gör att du kan skicka länkar direkt i prompten.
Praktiska teststeg: Skicka länkar och be om sammanställning av innehåll och bilder.
6B. Google: “Nano Banana” (Gemini 2.5 Flash Image)
Vad det är: Ett nytt läge för bildgenerering/redigering med låg latens och konsekvent identitet över flera bilder.
- Styrkor: Identitetskonsekvens, multi-image fusion, konverserande redigering, SynthID-vattenmärkning.
- Plattformar: Gemini-appen, AI Studio och Gemini API.
- Begränsningar: Små ansikten, text i bilder, detaljgeometri.
Snabbguide:
Nano Banana = snabb, interaktiv redigering.
Imagen 4 = högkvalitativ rendering från grunden.
7. AWS Bedrock: AgentCore
Huvudpoängen: Agentlösningar utan egen infrastruktur.
Nyhet: Browser Tool, minne, identitet via IAM + Claude Opus 4.1.
8. NVIDIA “Physical AI”
Huvudpoängen: Uppdateringar inom simulering och robotik, Jetson Thor kör lokala AI-modeller direkt i robotar.
9. Ramverk och verktyg: PyTorch 2.8, Transformers 4.54–4.55
Huvudpoängen: Enklare installationer, snabbare och mer minnessnål LLM-körning.
10. EU-regler: AI Act och viktiga datum
Huvudpoängen: Reglerna för GPAI gäller nu. De flesta högriskkrav träder i kraft 2026–2027.
- 2 aug 2025: skyldigheter för GPAI-modeller
- 2 aug 2026: AI Act allmänt tillämplig
- 2 aug 2027: sista dag för full efterlevnad
Relevans: Leverantörer inom EU måste följa nya krav. Sverige har egna riktlinjer (Digg + IMY).
11. GPT-5 bortom rubrikerna, epistemologi och reflektion
Mottagandet var spretigt från “katastrof” till “fantastiskt”. Orsaker: olika underliggande modeller, enorm användarbas, temporärt borttagna legacy-modeller. Tre avgörande axlar i produktion är kostnadseffektivitet, hallucinationsfrekvens och förmåga på stora kodbaser.
12. Sista ordet: Genie 3 – månadens mest banbrytande nyhet?
Även om OpenAI och Anthropic släppt stora uppdateringar är de mestadels inkrementella. Genie 3 flyttar gränsen från språkmodellering till fullskalig miljösimulering – vi går mot en framtid där vi inte bara pratar med modeller, vi besöker dem.