Otomotivde Nvidia’nın yüz aklarından Xinzhou Wu, otonom sürüş alanında rakiplerinden farklı olarak hangi stratejilerle ilerlediklerini paylaşırken, gerçek veri hırsına ihtiyaç olmadığını vurguladı. Şirketin iddiası, doğru sensörlerle gerçekten akıllı bir yapay zekanın birleştiğinde sıkı bir güvenlik ve akıcı sürüş sağlayabileceği yönünde.

Wu ile CEO Jensen Huang’ın Kaliforniya’dan San Francisco’ya uzanan test sürüşlerinde Mercedes CLA üzerinde MB.Drive Assist Pro sistemi kullanıldı. Sistem, sürücüsüz bir sürüş hedefiyle ilerlerken şantiye alanları, iki sıra halinde park edilmiş araçlar ve dar koridorlar gibi günlük engelleri güvenli bir şekilde yönetti ve sürücünün müdahalesine gerek duymadı. Nvidia’nın fiziksel yapay zeka kavramını hayata geçirirken müşterilerine yüksek veriye bağımlı bağımsız bir liderlik hedefiyle yaklaştığını belirtti.

Şirket, Tesla gibi çip tedarikçisi olmanın ötesinde Mercedes, Jaguar Land Rover ve Lucid gibi ortaklarına kendi yapay zeka destekli sürüş özelliklerini sunuyor. CES 2025’te duyurulan Alpamayo portföyü, belirli koşullarda Seviye 4 otonomi sunan AI modelleri, simülasyon şablonları ve veri setlerini kapsıyor. Huang bu tanıtımı “fiziksel yapay zeka için ChatGPT anı” olarak nitelendirmişti.

Alpamayo’nun mantıksal çıkarım yeteneği, klasik mühendislik tabanlı sistemlerle birleşik yaklaşım sunuyor; bu hibrit yapı hem insan benzeri sürüş davranışını destekliyor hem de yol güvenliğini güçlendiren kuralların esas alındığı bir çerçeve doğuruyor. Nvidia, uçtan uca dünyada bu hibrit mimarinin tek örnek olduğuna vurgu yapıyor. Wu’ya göre sistemin en belirgin farkı, çoklu sensör entegrasyonu ile güvenli sürüş sağlayabilmesi. Kamera, radar ve ultrasonik sensörlerin yanı sıra bazı konfigürasyonlarda lidar kullanımı, zorlu koşullarda bile güvenliği artırıyor. Ancak lidar maliyeti artırsada Nvidia’nın dikey entegrasyon yaklaşımı, gereken performansı mümkün olan en uygun maliyetle elde etmeyi hedefliyor.
Test edilen Mercedes CLA’da 10 kamera, 5 radar ve 12 ultrasonik sensör bulunuyor; DRIVE Hyperion platformu ise değişik sensör yapılarını destekleyecek şekilde tasarlanmış durumda. Temel versiyon daha uygun maliyetli kamera ve radar kombinasyonuna dayanırken, ileri seviyelerde lidar eklenebiliyor. Wu, lidar maliyetlerinin düşmesiyle 40.000-50.000 dolar aralığındaki araçların bile ileri düzey otonomiyeti benimseyebileceğini öngörüyor. Simülasyonun gerçek dünyadaki veriye kıyasla bir avantaj olduğu konusunda da net bir duruş sergileyen Nvidia, iki ana strateji üzerinde çalışıyor: NuRec ile gerçek dünyadaki senaryoları yeniden inşa etmek ve sahne öğelerini değiştirerek uç durumları test etmek.
Waymo’nun şehir içindeki elektrik kesintisi esnasında robotaksilerin kavşakları kilitlemesi gibi olayları Nvidia simüle ederek sistemin güvenli tepkisini sağlıyor. Nihai hedef, milyarlarca kilometrelik gerçek dünya sürüş verisine ihtiyaç duymadan güvenli sürüşü mümkün kılmak; bu vizyon, Vision Language Action (VLA) adı verilen görsel-dil-eylem modelinin uygulanmasıyla hayata geçiriliyor. Görsel algı, dil anlayışı ve fiziksel eylemlerin tek bir yapıda birleştiği bu model, internet ölçekli veri setlerinden beslenen büyük temel modellerden faydalanıyor. Wu’ya göre sonraki adım, sisteme hafıza kazandırmak ve pekiştirmeli öğrenme ile modelin yeteneklerini daha da artırmak.
