NVIDIA și Microsoft Reinventează PC-ul: RTX Spark Rulează LLM-uri de 120B Parametri Local, Fără Cloud

AI Hardware

2026-06-04 · 8 min de citit

La Computex 2026, NVIDIA și Microsoft au anunțat RTX Spark — superchip-ul care aduce 1 petaflop AI și 128GB memorie unificată într-un laptop și rulează modele de 120B parametri complet local, fără cloud.

TAIPEI / SAN FRANCISCO, 1 iunie 2026 — La Computex 2026, NVIDIA și Microsoft au dezvăluit împreună cel mai ambițios proiect comun din istoria celor două companii: platforma RTX Spark, un superchip ARM proiectat să aducă puterea centrelor de date AI direct în laptopuri și desktop-uri compacte — și, odată cu ea, capacitatea de a rula modele de limbaj de 120 de miliarde de parametri complet local, fără nicio dependență de cloud.

Anunțul a generat imediat reacții în piețele financiare: acțiunile NVIDIA (NVDA) au câștigat 6,26% în ziua lansării, adăugând aproximativ 316 miliarde de dolari la capitalizarea de piață a companiei, care a ajuns la 5,38 trilioane de dolari.

Ce este RTX Spark și de ce contează

RTX Spark nu este un GPU de laptop mai rapid. Este o arhitectură complet nouă — un superchip care combină un procesor Grace ARM cu 20 de nuclee și un GPU Blackwell cu 6.144 de nuclee CUDA de generația a 5-a, conectate printr-un bus NVLink-C2C cu lățime de bandă de 900 GB/s. Totul pe un singur pachet, cu până la 128GB memorie LPDDR5X unificată și o putere de calcul AI de 1 petaflop.

Un model de tip Llama sau Qwen cu 120 de miliarde de parametri și o fereastră de context de 1 milion de tokeni poate rula în timp real, direct pe laptop, cu latență de sub 2 secunde per răspuns, fără niciun apel la un server extern.

Pentru comparație: aceleași modele, rulate astăzi pe laptop-urile Copilot+ existente, necesită zeci de round-trip-uri către Azure, cu timpi de răspuns de 10-15 secunde per task complex. Pe RTX Spark, demonstrația live de la Build 2026 a arătat un workflow complet — „găsește contractul din martie trecut, rezumă clauzele cheie și trimite o variantă revizuită la departamentul juridic" — completat în sub 2 secunde.

Arhitectura tehnică: ce face RTX Spark diferit

Superchip-ul Grace Blackwell în format consumer

Familia Grace Blackwell a fost până acum exclusivă centrelor de date — serverele DGX și HGX. RTX Spark este prima dată când întreaga stivă NVIDIA (CUDA, TensorRT, OptiX, DLSS, Reflex) ajunge într-un laptop cu grosimea de 14 milimetri și greutatea de 1,36 kilograme.

Memoria unificată — eliminarea blocajului clasic

Problema fundamentală a rulării LLM-urilor pe hardware consumer a fost întotdeauna memoria: un model de 70B parametri în FP16 necesită ~140GB RAM. Pe arhitecturile clasice, CPU și GPU au memorii separate, iar transferul de date între ele creează un bottleneck sever.

RTX Spark elimină această problemă prin memorie LPDDR5X unificată — atât CPU-ul Grace, cât și GPU-ul Blackwell accesează același pool de 128GB la 273 GB/s, fără penalizarea de bandă a unui bus PCIe tradițional. Aceeași abordare arhitecturală a făcut Apple Silicon competitiv pentru inferență locală — dar aici cu stiva CUDA completă și compatibilitate nativă Windows.

Performanță de inferență

NVIDIA anunță o îmbunătățire de 2× față de generația anterioară pentru modelele agentic de top, prin optimizări în llama.cpp și vLLM. Tensor Core-urile de a 5-a generație suportă FP4, FP8, FP16 și BF16 — formatul FP4 permite reducerea la jumătate a dimensiunii modelelor fără pierderi semnificative de calitate.

Parteneriatul Microsoft: Windows devine un OS agentic

La Microsoft Build 2026, desfășurat simultan în San Francisco, compania a dezvăluit Windows Copilot Runtime — un nou subsistem al Windows 11 care oferă agenților AI acces securizat la fișierele locale, setările sistemului, periferice și aplicații, totul rulând pe hardware-ul RTX Spark.

NVIDIA OpenShell

OpenShell este framework-ul NVIDIA pentru rularea agenților autonomi pe Windows, construit deasupra noilor primitive de securitate Microsoft. Concret, înseamnă că un agent AI poate:

Accesa fișiere și aplicații pe care utilizatorul i le permite explicit.
Executa task-uri multi-step peste noapte, când calculatorul nu este folosit.
Rula complet local — datele nu ies niciodată din mașină.

Sistemul include guardrails arhitecturale: un agent nu poate accesa mai mult decât îi este explicit acordat, iar fiecare acțiune este logată în audit trails imutabile, accesibile utilizatorului. Cele mai populare proiecte open-source — Hermes Agent și OpenClaw — integrează deja OpenShell în aplicațiile lor native pentru Windows.

Specificații complete RTX Spark

CPU: Grace ARM, 20 nuclee, eficiență maximă.
GPU: Blackwell RTX, 6.144 nuclee CUDA, Tensor 5th gen.
Tensor Cores: FP4 / FP8 / FP16 / BF16.
Putere AI: 1 PetaFLOP.
Memorie unificată: până la 128GB LPDDR5X la 273 GB/s.
Interconect CPU-GPU: NVLink-C2C, 900 GB/s.
LLM maxim (local): 120B parametri, 1M token context.
Factori de formă: laptop 14-16", desktop compact. Grosime minimă 14mm, greutate ~1,36 kg.
Display: OLED tandem, G-SYNC, color-accurate.
Stack software: CUDA, TensorRT, OptiX, DLSS 4.5, Reflex.
Disponibilitate: toamna 2026.

Cine produce device-uri cu RTX Spark

NVIDIA a confirmat la Computex 2026 că opt producători majori au deja designuri în dezvoltare pentru toamna lui 2026. Confirmat pentru lansare: ASUS (ProArt P16, P14, Mini PC), Dell, HP, Lenovo, Microsoft Surface, MSI. Urmează: Acer, GIGABYTE.

ASUS a dezvăluit că rearhitecturează Adobe Photoshop și Premiere Pro pentru RTX Spark, cu o performanță de 2× față de versiunile actuale. Blender va putea reda scene 3D de peste 90GB și edita video 12K 4:2:2 direct în timp real. Microsoft Surface RTX Spark Dev Box — anunțat la Build 2026 — este gândit specific pentru developeri.

Contextul competitiv: Intel, AMD, Qualcomm, Apple

vs. Apple Silicon (M4 Ultra): Apple a fost liderul necontestat în inferență locală pe laptop. RTX Spark aduce aceeași abordare de memorie unificată, dar cu stiva CUDA completă și ecosistemul Windows — compatibilitate nativă cu PyTorch, Hugging Face, vLLM, fără portare.

vs. Qualcomm Snapdragon X Elite: RTX Spark oferă de 5-10× mai multă putere AI brută, la prețul unui consum energetic mai ridicat.

vs. Intel Core Ultra / AMD Ryzen AI: ambele satisfac cerința Microsoft de 40 TOPS pentru Copilot+, dar sunt departe de 1 petaflop. Rămân competitive în gaming și workstation x86 unde compatibilitatea software este prioritară.

Prețul rămâne neconfirmat. Laptop-urile RTX Spark se estimează între 1.500 și 2.500 USD pentru configurațiile entry, cu modele premium depășind 3.000 USD.

Ce înseamnă pentru companiile care folosesc AI

Confidențialitate reală pentru date sensibile — contracte, date medicale, informații financiare procesate exclusiv local.
Eliminarea costurilor de API cloud pentru volumele mari — un model 120B local înseamnă zero costuri de token pentru utilizarea internă.
Agenți AI care lucrează offline — task-uri complexe rulate noaptea, fără conexiune activă la internet.
Fine-tuning local pe date proprietare — 128GB unified memory permit antrenare suplimentară a modelelor 7B-13B direct pe device.

Relevanță pentru ecosistemul Visual AI Labs

Platforma RTX Spark validează direct direcția strategică pe care o urmărim la Visual AI Labs: construirea de sisteme AI care rulează local sau în infrastructura companiei, fără dependență de cloud, cu date care nu ies niciodată din perimetrul organizației.

Soluțiile pe care le construim — procesare inteligentă de documente, agenți AI interni, asistenți antrenați pe date proprietare — sunt proiectate cu această arhitectură în minte. RTX Spark înseamnă că aceste soluții vor putea rula acum și pe workstation-uri sau laptop-uri premium ale angajaților, nu doar pe servere dedicate.

Evaluare gratuită — strategia ta AI on-device cu Visual AI Labs →