NVIDIA’s nieuwe Rubin CPX chip verwerkt miljoenen tokens tegelijk

Tijdens de jaarlijkse GTC-conferentie onthulde NVIDIA de Rubin CPX, een nieuwe generatie GPU speciaal ontworpen voor zogenaamde massive-context AI-verwerking. De chip is in staat om taken te verwerken waarbij miljoenen tokens tegelijk in het geheugen moeten worden gehouden — denk aan het analyseren van volledige softwareprojecten of het genereren van lange video’s in één keer.

De Rubin CPX is de opvolger van de bestaande Rubin-lijn en vult een gat in de markt: bestaande GPU’s lopen vast bij extreem lange context-vensters, terwijl AI-modellen steeds grotere hoeveelheden data tegelijk willen verwerken. NVIDIA verwacht de chip eind 2026 beschikbaar te maken via cloudproviders als AWS, Google Cloud en Microsoft Azure.

De aankondiging markeert ook een bredere verschuiving bij NVIDIA: naast GPU’s investeert het bedrijf steeds meer in geoptimaliseerde CPU’s voor AI-workloads. De combinatie van CPU en GPU in één rack moet de bottleneck wegnemen die de groei van AI-agenten momenteel vertraagt.