Nomadic zielt auf die unsichtbare Schaltstelle im Datenstrom autonomer Fahrzeuge
Einordnung
Autonome Fahrzeuge gelten als Meisterwerke der Sensorik – doch ihr größtes Problem ist inzwischen nicht mehr das „Sehen“, sondern der Umgang mit all den Daten, die sie sehen. Millionen Stunden Video und Sensormessungen landen auf Speichersystemen, ohne je wieder angerührt zu werden. Genau an dieser unscheinbaren Stelle dazwischen setzt NomadicML an. Wer diese Schicht kontrolliert, entscheidet künftig darüber, welche Erfahrungen in die Modelle einfließen – und damit über Sicherheit, Kosten und Marktvorteile. Im Folgenden analysieren wir, was hinter der 8,4‑Millionen‑Dollar‑Runde steckt und welche Konsequenzen das für die europäische Industrie hat.
Die Nachricht in Kürze
Wie TechCrunch berichtet, hat NomadicML eine Seed‑Finanzierung in Höhe von 8,4 Millionen US‑Dollar zu einer Bewertung von 50 Millionen Dollar nach Geldzufluss abgeschlossen. Angeführt wurde die Runde von TQ Ventures, beteiligt waren unter anderem Pear VC sowie der frühere Google‑KI‑Chef Jeff Dean. Das von Mustafa Bal und Varun Krishnan gegründete Start‑up entwickelt eine Plattform, die Videodaten aus autonomen Fahrzeugen und Robotern automatisch mit Hilfe mehrerer Vision‑Language‑Modelle in strukturierte, durchsuchbare Datensätze verwandelt.
Adressiert werden Unternehmen, deren Flotten riesige Mengen an Sensordaten erzeugen, von denen der Großteil bisher ungenutzt archiviert wird. Nomadic soll vor allem seltene, aber sicherheitsrelevante Sonderfälle identifizieren, das Flottenmonitoring unterstützen und maßgeschneiderte Datensätze für Reinforcement Learning bereitstellen. Bereits heute zählen Zoox, Mitsubishi Electric, Natix Network und Zendar zu den Kunden. Zudem gewann Nomadic kürzlich den Pitch‑Wettbewerb auf der Nvidia‑Konferenz GTC und arbeitet nun daran, auch Lidar‑ und weitere Sensormodalitäten zu integrieren.
Warum das wichtig ist
Nomadic ist mehr als eine modernere Annotationsplattform. Das Unternehmen positioniert sich an der Stelle, an der entschieden wird, welche realen Erlebnisse einer Flotte tatsächlich im Trainingsmaterial landen – und welche nie wieder jemand sieht. In der Praxis gleicht der Umgang mit AV‑Daten heute einem Fischfang, bei dem 95 % der Beute sofort über Bord gehen, weil man nicht die Kapazitäten hat, sie zu sortieren.
Gelingt es, diese Datenmassen in eine Art „abfragbares Gedächtnis“ zu verwandeln – mit Abfragen wie „zeige alle Rotlichtsituationen mit polizeilicher Einweisung“, „alle Fahrten unter einer bestimmten Brückenart“ oder „alle Fälle, in denen der Roboterarm sein Ziel verfehlt hat“ –, dann verschiebt sich die Wettbewerbslage. Nicht nur Alphabet‑ und Amazon‑Konzerne können sich ausgefeilte Datentools leisten, sondern auch mittelgroße Zulieferer oder Robotik‑Start‑ups aus Europa.
Kurzfristig profitieren Entwicklungsteams, die unter Compliance‑ und Kostendruck stehen: Sie können gezielter Daten sammeln, schneller iterieren und regulatorische Nachweise effizienter erbringen. Unter Druck geraten hingegen klassische Labeling‑Dienstleister mit stark manueller Prägung. Gleichzeitig entstehen neue Risiken: Wenn Algorithmen bestimmen, welche Szenen „wichtig“ sind, können sich Verzerrungen einschleichen. Modelle könnten dann spektakuläre Edge Cases hervorragend beherrschen, aber bei alltäglichen Situationen Lücken haben.
Strategisch signalisiert die Runde, dass sich der Fokus in der physischen KI von der Modell‑Exzellenz zur Daten‑Exzellenz verlagert. Wer die Infrastruktur kontrolliert, die reale Fahrdaten in Trainingsjobs übersetzt, wird zu einer Art Schaltstelle – vergleichbar mit Snowflake oder Databricks in der Welt der Geschäftsdaten.
Der größere Kontext
Nomadics Ansatz passt in mehrere übergeordnete Entwicklungen.
Erstens erleben wir eine Welle spezialisierter KI‑Infrastruktur. Anbieter wie Scale, Kognic und Encord setzen zunehmend auf KI‑gestützte Auto‑Annotation und Szenenverständnis. Nvidia steuert mit der offenen Modellfamilie Alpamayo technologische Bausteine bei. Nomadic versucht, sich darüber zu platzieren: nicht primär Bounding Boxes produzieren, sondern als „agentisches System“ agieren, das komplexe Anfragen zerlegt, verschiedene Modelle orchestriert und fertig kuratierte Datensätze liefert.
Zweitens steht die physische KI an einem Wendepunkt. Robotaxis in den USA, Lieferroboter, autonome Gabelstapler in Logistikzentren, Feldroboter in der Landwirtschaft – sie alle hängen von der Qualität ihrer Erfahrungsdaten ab. In der Cloud‑Historie sahen wir bereits, wie Infrastruktur sich entkoppelt hat: Kaum jemand baut mehr eigene Rechenzentren; stattdessen haben sich Cloud‑Provider und darüber Data‑Plattformen etabliert. In der Robotik zeichnet sich eine ähnliche Schichtung ab: Hardware und Basismodelle werden austauschbarer, der Hebel liegt in den Datenpipelines.
Drittens drängen sogenannte „agentische“ Ansätze nach vorn. Im Textbereich kennen wir Retrieval‑Augmented Generation: LLMs greifen auf externe Wissensquellen zu. Nomadic überträgt dieses Prinzip auf Video und multimodale Logs: Das System sucht in riesigen Datenbanken gezielt nach relevanten Szenen, um Modelle nachzutrainieren oder Vorfälle zu analysieren. Das Konzept ist universell einsetzbar – von industrieller Inspektion über Sicherheitstechnik bis hin zur Medizintechnik.
Spannend wird, ob es spezialisierten Start‑ups gelingt, sich gegen Hyperscaler wie AWS, Google Cloud, Microsoft und Nvidia zu behaupten, die prinzipiell ähnliche Funktionen tief in ihre Plattformen integrieren könnten.
Die europäische Perspektive
Für den DACH‑Raum ist das Thema gleich in mehrfacher Hinsicht relevant. Deutschland ist Heimat großer OEMs (VW, Mercedes‑Benz, BMW) und einer starken Zulieferindustrie, die intensiv an Assistenzsystemen und höheren Automatisierungsgraden arbeitet. Parallel verschärfen EU‑Regeln wie die DSGVO, der Digital Services Act und vor allem der kommende EU‑AI‑Act die Anforderungen an Transparenz, Datenherkunft und Dokumentation bei Hochrisiko‑KI – wozu viele autonome Systeme zählen werden.
Ein Werkzeug wie Nomadic kann hier zum Compliance‑Enabler werden: Wenn ein Hersteller gegenüber dem Kraftfahrt‑Bundesamt oder einer anderen Aufsicht belegen muss, auf welchen konkreten Szenarien ein System trainiert und getestet wurde, braucht er eine fein granulare, nachvollziehbare Indexierung seiner Flottendaten. Auditierbare Queries über reale Fahrten sind dann kein „Nice to have“, sondern Grundlage für Zulassungen.
Gleichzeitig stellt sich die Frage der Datensouveränität. Viele europäische Unternehmen möchten sicherstellen, dass sensible Fahrzeug‑ und Standortdaten im Rechtsraum der EU verbleiben. Hier haben Projekte wie Gaia‑X oder regionale Cloud‑Anbieter (zum Beispiel in Deutschland, Frankreich oder der Schweiz) Ansatzpunkte, um ähnliche Funktionalitäten wie Nomadic auf europäischer Infrastruktur anzubieten – oder Partnerschaften einzugehen.
Für Start‑ups in Berlin, München oder Zürich, die an autonomen Lieferfahrzeugen, Drohnen oder Industrie‑Robotik arbeiten, wird die Verfügbarkeit solcher Werkzeuge zum Wettbewerbsfaktor: Wer seine Daten besser kuratiert, kann mit weniger Testkilometern zu robusteren Modellen kommen – ein Vorteil, wenn Budgets im Vergleich zu US‑Playern begrenzt sind.
Ausblick
In den kommenden zwei bis drei Jahren wird sich zeigen, ob Nomadic aus der Nische der „smarten Video‑Suche“ herauswächst und zur unverzichtbaren Infrastrukturkomponente avanciert. Technisch sind mehrere Baustellen absehbar: Unterstützung weiterer Sensorarten, Synchronisation verschiedener Datenströme, Skalierung auf tausende Fahrzeuge in Echtzeit sowie tiefe Integrationen in MLOps‑Stacks und Simulationstools.
Geschäftlich stehen zwei Szenarien im Raum. Im optimistischen Fall etabliert sich Nomadic als neutraler Layer zwischen Flottenbetreibern, Cloud‑Providern und KI‑Modellhäusern – vergleichbar mit unabhängigen Data‑Warehouses. Im pessimistischen Fall bauen große AV‑Player eigene Systeme, während Cloud‑Anbieter ähnliche Funktionen als Zusatzservice in ihre Plattformen integrieren. Dann bliebe nur ein begrenzter Markt für Spezialisten.
Beobachten sollte man Kooperationen mit großen Automobil‑ und Industrieunternehmen in Europa: Kommt es zu strategischen Partnerschaften oder gar Minderheitsbeteiligungen, wäre das ein Signal, dass hier eine kritische Infrastruktur entsteht. Spannend sind auch regulatorische Pilotprojekte – etwa, wenn Flottendaten‑Suchsysteme explizit in Sicherheitsnachweisen oder Typgenehmigungen referenziert werden.
Eine offene Flanke bleibt die Governance. Wie lassen sich Datenschutz (Anonymisierung von Kennzeichen, Gesichtern), Löschkonzepte und Bias‑Kontrollen so in agentische Systeme integrieren, dass sie nicht nur auf dem Papier existieren? Angesichts der Datenschutzsensibilität in der DACH‑Region könnte genau dies zum Differenzierungsmerkmal zwischen Anbietern werden.
Fazit
Die 8,4‑Millionen‑Runde von Nomadic ist weniger wegen ihrer Höhe bemerkenswert als wegen ihres Signals: In der Welt der autonomen Systeme rückt die unscheinbare Daten‑Infrastruktur zwischen Sensor und Modell ins Zentrum. Ob am Ende ein Start‑up wie Nomadic, ein Cloud‑Konzern oder ein europäischer Newcomer diese Schicht dominiert, ist offen. Klar ist nur: Wer künftig über autonome Fahrzeuge und Robotik spricht, sollte nicht mehr nur über Algorithmen diskutieren, sondern über die Qualität der Datenmotoren dahinter. Wo möchten Sie als europäischer Akteur in dieser neuen Wertschöpfungskette stehen?



