NVIDIA și Microsoft Reinventează PC-ul: RTX Spark Rulează LLM-uri de 120B Parametri Local, Fără Cloud
AI Hardware
· 8 min de citit
La Computex 2026, NVIDIA și Microsoft au anunțat RTX Spark — superchip-ul care aduce 1 petaflop AI și 128GB memorie unificată într-un laptop și rulează modele de 120B parametri complet local, fără cloud.
TAIPEI / SAN FRANCISCO, 1 iunie 2026 — La Computex 2026, NVIDIA și Microsoft au dezvăluit împreună cel mai ambițios proiect comun din istoria celor două companii: platforma RTX Spark, un superchip ARM proiectat să aducă puterea centrelor de date AI direct în laptopuri și desktop-uri compacte — și, odată cu ea, capacitatea de a rula modele de limbaj de 120 de miliarde de parametri complet local, fără nicio dependență de cloud.
Anunțul a generat imediat reacții în piețele financiare: acțiunile NVIDIA (NVDA) au câștigat 6,26% în ziua lansării, adăugând aproximativ 316 miliarde de dolari la capitalizarea de piață a companiei, care a ajuns la 5,38 trilioane de dolari.
Ce este RTX Spark și de ce contează
RTX Spark nu este un GPU de laptop mai rapid. Este o arhitectură complet nouă — un superchip care combină un procesor Grace ARM cu 20 de nuclee și un GPU Blackwell cu 6.144 de nuclee CUDA de generația a 5-a, conectate printr-un bus NVLink-C2C cu lățime de bandă de 900 GB/s. Totul pe un singur pachet, cu până la 128GB memorie LPDDR5X unificată și o putere de calcul AI de 1 petaflop.
Un model de tip Llama sau Qwen cu 120 de miliarde de parametri și o fereastră de context de 1 milion de tokeni poate rula în timp real, direct pe laptop, cu latență de sub 2 secunde per răspuns, fără niciun apel la un server extern.
Pentru comparație: aceleași modele, rulate astăzi pe laptop-urile Copilot+ existente, necesită zeci de round-trip-uri către Azure, cu timpi de răspuns de 10-15 secunde per task complex. Pe RTX Spark, demonstrația live de la Build 2026 a arătat un workflow complet — „găsește contractul din martie trecut, rezumă clauzele cheie și trimite o variantă revizuită la departamentul juridic" — completat în sub 2 secunde.
Arhitectura tehnică: ce face RTX Spark diferit
Superchip-ul Grace Blackwell în format consumer
Familia Grace Blackwell a fost până acum exclusivă centrelor de date — serverele DGX și HGX. RTX Spark este prima dată când întreaga stivă NVIDIA (CUDA, TensorRT, OptiX, DLSS, Reflex) ajunge într-un laptop cu grosimea de 14 milimetri și greutatea de 1,36 kilograme.
Memoria unificată — eliminarea blocajului clasic
Problema fundamentală a rulării LLM-urilor pe hardware consumer a fost întotdeauna memoria: un model de 70B parametri în FP16 necesită ~140GB RAM. Pe arhitecturile clasice, CPU și GPU au memorii separate, iar transferul de date între ele creează un bottleneck sever.
RTX Spark elimină această problemă prin memorie LPDDR5X unificată — atât CPU-ul Grace, cât și GPU-ul Blackwell accesează același pool de 128GB la 273 GB/s, fără penalizarea de bandă a unui bus PCIe tradițional. Aceeași abordare arhitecturală a făcut Apple Silicon competitiv pentru inferență locală — dar aici cu stiva CUDA completă și compatibilitate nativă Windows.
Performanță de inferență
NVIDIA anunță o îmbunătățire de 2× față de generația anterioară pentru modelele agentic de top, prin optimizări în llama.cpp și vLLM. Tensor Core-urile de a 5-a generație suportă FP4, FP8, FP16 și BF16 — formatul FP4 permite reducerea la jumătate a dimensiunii modelelor fără pierderi semnificative de calitate.
Parteneriatul Microsoft: Windows devine un OS agentic
La Microsoft Build 2026, desfășurat simultan în San Francisco, compania a dezvăluit Windows Copilot Runtime — un nou subsistem al Windows 11 care oferă agenților AI acces securizat la fișierele locale, setările sistemului, periferice și aplicații, totul rulând pe hardware-ul RTX Spark.
NVIDIA OpenShell
OpenShell este framework-ul NVIDIA pentru rularea agenților autonomi pe Windows, construit deasupra noilor primitive de securitate Microsoft. Concret, înseamnă că un agent AI poate:
- Accesa fișiere și aplicații pe care utilizatorul i le permite explicit.
- Executa task-uri multi-step peste noapte, când calculatorul nu este folosit.
- Rula complet local — datele nu ies niciodată din mașină.
Sistemul include guardrails arhitecturale: un agent nu poate accesa mai mult decât îi este explicit acordat, iar fiecare acțiune este logată în audit trails imutabile, accesibile utilizatorului. Cele mai populare proiecte open-source — Hermes Agent și OpenClaw — integrează deja OpenShell în aplicațiile lor native pentru Windows.
Specificații complete RTX Spark
- CPU: Grace ARM, 20 nuclee, eficiență maximă.
- GPU: Blackwell RTX, 6.144 nuclee CUDA, Tensor 5th gen.
- Tensor Cores: FP4 / FP8 / FP16 / BF16.
- Putere AI: 1 PetaFLOP.
- Memorie unificată: până la 128GB LPDDR5X la 273 GB/s.
- Interconect CPU-GPU: NVLink-C2C, 900 GB/s.
- LLM maxim (local): 120B parametri, 1M token context.
- Factori de formă: laptop 14-16", desktop compact. Grosime minimă 14mm, greutate ~1,36 kg.
- Display: OLED tandem, G-SYNC, color-accurate.
- Stack software: CUDA, TensorRT, OptiX, DLSS 4.5, Reflex.
- Disponibilitate: toamna 2026.
Cine produce device-uri cu RTX Spark
NVIDIA a confirmat la Computex 2026 că opt producători majori au deja designuri în dezvoltare pentru toamna lui 2026. Confirmat pentru lansare: ASUS (ProArt P16, P14, Mini PC), Dell, HP, Lenovo, Microsoft Surface, MSI. Urmează: Acer, GIGABYTE.
ASUS a dezvăluit că rearhitecturează Adobe Photoshop și Premiere Pro pentru RTX Spark, cu o performanță de 2× față de versiunile actuale. Blender va putea reda scene 3D de peste 90GB și edita video 12K 4:2:2 direct în timp real. Microsoft Surface RTX Spark Dev Box — anunțat la Build 2026 — este gândit specific pentru developeri.
Contextul competitiv: Intel, AMD, Qualcomm, Apple
vs. Apple Silicon (M4 Ultra): Apple a fost liderul necontestat în inferență locală pe laptop. RTX Spark aduce aceeași abordare de memorie unificată, dar cu stiva CUDA completă și ecosistemul Windows — compatibilitate nativă cu PyTorch, Hugging Face, vLLM, fără portare.
vs. Qualcomm Snapdragon X Elite: RTX Spark oferă de 5-10× mai multă putere AI brută, la prețul unui consum energetic mai ridicat.
vs. Intel Core Ultra / AMD Ryzen AI: ambele satisfac cerința Microsoft de 40 TOPS pentru Copilot+, dar sunt departe de 1 petaflop. Rămân competitive în gaming și workstation x86 unde compatibilitatea software este prioritară.
Prețul rămâne neconfirmat. Laptop-urile RTX Spark se estimează între 1.500 și 2.500 USD pentru configurațiile entry, cu modele premium depășind 3.000 USD.
Ce înseamnă pentru companiile care folosesc AI
- Confidențialitate reală pentru date sensibile — contracte, date medicale, informații financiare procesate exclusiv local.
- Eliminarea costurilor de API cloud pentru volumele mari — un model 120B local înseamnă zero costuri de token pentru utilizarea internă.
- Agenți AI care lucrează offline — task-uri complexe rulate noaptea, fără conexiune activă la internet.
- Fine-tuning local pe date proprietare — 128GB unified memory permit antrenare suplimentară a modelelor 7B-13B direct pe device.
Relevanță pentru ecosistemul Visual AI Labs
Platforma RTX Spark validează direct direcția strategică pe care o urmărim la Visual AI Labs: construirea de sisteme AI care rulează local sau în infrastructura companiei, fără dependență de cloud, cu date care nu ies niciodată din perimetrul organizației.
Soluțiile pe care le construim — procesare inteligentă de documente, agenți AI interni, asistenți antrenați pe date proprietare — sunt proiectate cu această arhitectură în minte. RTX Spark înseamnă că aceste soluții vor putea rula acum și pe workstation-uri sau laptop-uri premium ale angajaților, nu doar pe servere dedicate.
Evaluare gratuită — strategia ta AI on-device cu Visual AI Labs →