Nomadic apuesta por ser el "cerebro" de los datos en los coches autónomos
Introducción
Los coches autónomos ya no compiten solo por quién tiene el mejor modelo de conducción, sino por quién sabe exprimir mejor los datos que genera cada kilómetro recorrido. Flotas enteras producen petabytes de vídeo y sensores que casi nadie vuelve a mirar. Ahí es donde NomadicML quiere colocarse: en la capa que decide qué trozos de realidad alimentan a los modelos y cuáles se pierden para siempre. Analizamos qué hay detrás de su ronda de 8,4 millones de dólares, por qué importa para la industria global y qué oportunidades abre para Europa y el mundo hispanohablante.
La noticia en breve
Según informa TechCrunch, NomadicML ha cerrado una ronda seed de 8,4 millones de dólares, con una valoración post‑money de 50 millones. La operación ha sido liderada por TQ Ventures, con la participación de Pear VC y del exresponsable de IA de Google, Jeff Dean, entre otros. La startup, fundada por Mustafa Bal y Varun Krishnan, ha desarrollado una plataforma que ingiere vídeo procedente de vehículos autónomos y robots y lo convierte automáticamente en un conjunto de datos estructurado y consultable mediante una colección de modelos de visión‑lenguaje.
El producto está dirigido a compañías cuyas flotas generan enormes volúmenes de datos que hoy acaban, en su mayoría, en archivos fríos porque es inviable revisarlos a mano. El sistema de Nomadic identifica casos extremos, ayuda al seguimiento de flotas y genera conjuntos de datos específicos para aprendizaje por refuerzo. Entre sus primeros clientes figuran Zoox, Mitsubishi Electric, Natix Network y Zendar. La empresa ganó recientemente el concurso de startups en la conferencia GTC de Nvidia y trabaja ahora en extender su enfoque más allá del vídeo, hacia lidar y otros sensores.
Por qué es importante
Nomadic no pretende competir con Waymo o Tesla en conducción autónoma, sino con algo mucho menos vistoso y potencialmente más estratégico: la capa de datos. En la práctica, casi todos los proyectos de vehículos y robots autónomos se encuentran con el mismo cuello de botella: toneladas de datos sin estructura, de los que solo se aprovecha una fracción mínima para entrenar y validar modelos.
Si la plataforma de Nomadic consigue convertir ese caos en un repositorio consultable – con preguntas del tipo «muéstrame todas las veces que un coche se saltó un semáforo siguiendo las indicaciones de un agente de tráfico» o «localiza cada cambio de carril en lluvia nocturna» –, cambia quién puede jugar esta partida. Ya no hace falta un ejército de ingenieros de tooling internos para exprimir los datos de una flota; un fabricante mediano de autobuses autónomos en España o un operador de robots logísticos en México podrían, en teoría, acceder al mismo tipo de capacidades.
Los beneficiados inmediatos son los equipos que viven entre la presión regulatoria y la escasez de talento: pueden acelerar iteraciones de modelo, preparar informes de seguridad y cumplir requisitos de auditoría con menos fricción. Los perdedores potenciales son los proveedores de etiquetado puramente manual que no añadan inteligencia propia a la capa de datos.
Pero la automatización también trae dilemas: ¿qué sesgos introduce un sistema que decide qué escenas son «interesantes»? ¿Quién garantiza que se respeta la privacidad de peatones y matrículas? En un mundo regulado por normas como el GDPR y pronto la Ley Europea de IA, estas preguntas no son académicas, sino existenciales para el negocio.
El cuadro más amplio
Lo que está haciendo Nomadic encaja en varias tendencias que llevan tiempo gestándose.
Primero, la industria se está moviendo de la obsesión por el modelo «estrella» hacia la obsesión por el ciclo de datos. Empresas como Scale, Kognic o Encord llevan unos años automatizando el etiquetado con IA. Nvidia ha publicado la familia Alpamayo como base abierta para casos similares. Nomadic propone ir un paso más allá: en lugar de limitarse a dibujar cajas, construye un sistema que razona sobre secuencias completas, entiende contexto y genera lotes de datos muy específicos bajo demanda.
Segundo, la llamada «IA física» está saliendo de los laboratorios hacia aplicaciones reales: robotaxis, robots de reparto en aceras, brazos robóticos en almacenes, drones de inspección, maquinaria pesada semiautónoma en minería o construcción… Todos comparten un patrón: el valor no está solo en el modelo, sino en la capacidad de reutilizar cada hora de operación como materia prima para mejorar el sistema.
La analogía con la nube y el big data es clara. Durante años, las empresas construían su propia infraestructura; luego llegaron AWS, Azure o Google Cloud. Más tarde, plataformas como Snowflake o Databricks se hicieron imprescindibles para organizar y explotar los datos corporativos. La apuesta de Nomadic es que algo similar ocurrirá con los datos de sensores en el mundo físico.
Tercero, los enfoques «agénticos» – sistemas que descomponen una petición, coordinan varios modelos y refinan los resultados – están madurando rápido. Lo que hoy se usa para hacer RAG sobre documentos se está trasladando a vídeo y sensores. No solo interesa a coches: ciudades que monitorizan tráfico, empresas de seguridad, ligas deportivas que analizan jugadas… todos se enfrentan a océanos de vídeo poco estructurado.
La cuestión abierta es si este nuevo estrato lo capturarán los hyperscalers (Nvidia, las grandes nubes) integrándolo en su oferta, o si startups especializadas como Nomadic pueden defender un hueco propio.
La perspectiva europea e hispana
Europa combina dos ingredientes singulares: una potente industria automotriz y un marco regulatorio exigente. Fabricantes alemanes, franceses, italianos o suecos experimentan con funciones avanzadas de conducción y servicios de movilidad autónoma. Al mismo tiempo, el Reglamento de IA de la UE y normas previas como el GDPR o la Ley de Servicios Digitales obligarán a documentar mejor de dónde salen los datos de entrenamiento, cómo se etiquetan y cómo se validan.
Herramientas como Nomadic pueden convertirse en piezas clave para ese cumplimiento. Un OEM que quiera desplegar un sistema de conducción automatizada en autopistas españolas, por ejemplo, tendrá que demostrar ante autoridades nacionales y europeas en qué escenarios reales lo ha probado: lluvia, niebla, ciclistas, obras, vehículos de emergencia… Sin una indexación detallada de los datos de flota, ese ejercicio es casi imposible.
También está el ángulo de soberanía tecnológica. Muchas empresas europeas prefieren que los datos de sus flotas se almacenen y procesen en la UE. Eso abre espacio para alternativas regionales – quizá integradas con clouds europeos – que ofrezcan capacidades similares a Nomadic, pero con garantías de residencia de datos. Lo mismo aplica a América Latina, donde países como Brasil, México, Chile o Colombia avanzan en marcos propios de protección de datos y no quieren depender al 100 % de proveedores estadounidenses.
Para startups en Barcelona, Madrid, Ciudad de México o Bogotá que trabajen en robots de última milla, buses autónomos o drones de inspección, contar con una capa de datos sofisticada puede marcar la diferencia entre hacer una demo puntual y escalar a operaciones reales en varias ciudades.
Mirando hacia adelante
En los próximos dos o tres años, Nomadic tendrá que demostrar tres cosas. Primero, que puede ir más allá del vídeo e integrar de forma robusta lidar, radar, GPS, inerciales y mapas. La verdadera magia no es encontrar una escena curiosa, sino correlacionar todas las señales para entender por qué el sistema se comportó como lo hizo.
Segundo, que sabe integrarse en los flujos de MLOps y simulación existentes. Los equipos de AV y robótica no quieren otra herramienta aislada, sino algo que conecte directamente las escenas encontradas con nuevos entrenamientos, pruebas en simuladores y despliegues en la flota.
Tercero, que puede escalar geográfica y sectorialmente: de los primeros clientes de Silicon Valley y Japón a OEM europeos, operadores de transporte público, empresas logísticas y, por qué no, proyectos de smart cities en Latinoamérica.
En paralelo veremos dos movimientos: grandes actores construyendo soluciones internas para no depender de terceros, y proyectos open source intentando ofrecer algo parecido con menor coste. Si esas alternativas se muestran frágiles o difíciles de mantener, el argumento a favor de una plataforma dedicada como Nomadic ganará fuerza.
Los riesgos no son menores: dependencia de modelos de terceros, costes de cómputo elevados, posibles choques con reguladores de privacidad si no se gestiona bien la anonimización. Pero también hay una oportunidad clara: convertirse en el estándar de facto para responder a la pregunta que todos los reguladores y aseguradoras harán a partir de ahora: «¿en qué datos reales se basa este sistema?».
Conclusión
La ronda de 8,4 millones de Nomadic es modesta frente a las cifras que se manejan en grandes modelos de IA, pero apunta al lugar donde se va a jugar la próxima batalla: la infraestructura de datos de la IA física. Todos los proyectos serios de vehículos y robots autónomos necesitarán algo así. La duda es si Europa y el mundo hispano serán meros clientes de soluciones ajenas o si también construirán sus propios cimientos. Como lector, desarrollador o regulador, la pregunta es directa: ¿quién quiere que controle la memoria de sus máquinas?



