Ny AI-teknik köper tid åt regering och opposition

Artificiell Intelligens. Free image from Pixabay.
  • Måndag 30 mar 2026 2026-03-30
E-post

Under förra veckan släppte söktjänstföretaget Google nyheten om en teknisk lösning som kan komma att minska AI-centers effektbehov med upp till 50 procent. En välkommen nyhet för båda de politiska blocken som gjort satsningarna på AI till en framtidsfråga. Men tjänsten innebär inte en enskild framtidslösning, endast att de omedelbara behoven av ökning av elproduktionen dämpas något.

Näringsminister Ebba Busch (KD) har lyft fram AI-tjänster som ett prioriterat område. Även Mikael Damberg (S) har betonat teknikens och behovet av datacenters betydelse sedan tidigare. Utvecklingen har ökat efterfrågan på beräkningskapacitet och elförsörjning, samtidigt som elektrifieringen ställer krav på effektiv energianvändning.

Google Research har nyligen presenterat TurboQuant, en programvarulösning som adresserar en central begränsning i AI-system: minnesanvändning. Därmed påverkas även förutsättningarna för utbyggnaden av AI-datacenter.

TurboQuant möjliggör kraftig kompression av stora språkmodeller utan mätbar kvalitetsförlust. Tekniken reducerar den så kallade key-value-cachen, som kan stå för upp till 90 procent av minnesanvändningen, från 16 bitar till omkring 3 bitar per enhet. Detta ger ett väsentligt lägre minnesbehov.

Metoden bygger på två komponenter:

  • PolarQuant, som omvandlar vektorer till polära koordinater för att minska lagringsbehovet
  • Quantized Johnson-Lindenstrauss (QJL), som reducerar kvantiseringsfel med begränsad beräkningskostnad

Prestandamätningar visar betydande förbättringar. På hårdvara som NVIDIA H100 rapporteras upp till åtta gånger högre beräkningshastighet jämfört med tidigare standard. Tester på modeller som Gemma, Mistral och Llama 3.1 8B visar bibehållen kvalitet enligt etablerade utvärderingsmått.

Köper sig tid

För operatörer innebär Googles lösning att befintlig hårdvara kan användas mer effektivt. Fler användare, längre kontextfönster och högre genomströmning kan hanteras utan ytterligare investeringar i processorkapacitet. Detta påverkar två centrala kostnadsfaktorer:

  • energiförbrukning, där minnesåtkomst är en betydande komponent
  • kylning och effektkapacitet i datacenter

Tidiga uppskattningar indikerar att driftkostnader kan reduceras med upp till 50 procent.

På kort till medellång sikt kan detta dämpa investeringstakten i nya AI-datacenter. Behovet av utbyggnad minskar när befintlig kapacitet utnyttjas mer effektivt. En sannolik och omedelbar konsekvens är en temporär inbromsning i utbyggnadstakten.

Effektiviseringar tenderar dock att öka efterfrågan över tid. Lägre kostnad per beräkning möjliggör fler tillämpningar, fler användare och mer komplexa modeller. Utvecklingen omfattar bland annat längre kontextfönster, multimodala system och agentbaserade applikationer.

TurboQuant förändrar därmed inte den långsiktiga utvecklingsriktningen. Tekniken innebär en ökad effektivitet i befintliga system och kan ge ett tillfälligt utrymme i kapacitetsutbyggnaden, men påverkar inte den underliggande efterfrågetillväxten långsiktigt.

Innehållet som publiceras på Ledarsidorna.se omfattas av grundlagsskydd. Detta inkluderar inte kommentarsfältet. Du som kommenterar är helt ansvarig för det du skriver.

Mer från Ledarsidorna.se