$6.1 mil millones y un giro radical: así han cambiado las reglas del juego robótico

En 2025, la inversión en robots humanoides alcanzó los $6.1 mil millones, cifra que cuadruplica la de 2024. Un salto brutal que no es producto de la casualidad, sino del salto cuántico en la forma en que estos autómatas aprenden y actúan. Hasta hace no mucho, los ingenieros soñaban gigantes, apuntando a robots tipo C-3PO, pero el resultado siempre terminaba siendo un Roomba más bien simplón. El fiasco estaba en la eterna estrategia: escribir reglas y escribir más reglas para cada posible situación. Entonces llegaba el caos. Y la vida real nunca es tan limpia ni predecible.

Jugaban a anticipar cada movida de la realidad y codificar las instrucciones exactas, pero el resultado era tan complejo y frágil que un simple cambio de ángulo o una arruga en la camiseta arruinaba el sistema. Hace menos de una década, cambió todo con la llegada del aprendizaje profundo. Los robots dejaron de ser esclavos del código y empezaron a aprender mediante ensayo y error, millones de veces, en simuladores digitales que replicaban los objetos y las condiciones reales, y no solo eso, también con modelos de lenguaje potentes que integran información sensorial y visual para tomar decisiones en tiempo real.

¿Qué significa eso? Que la industria metió la directa para crear máquinas que no solo repitan movimientos fijos, sino que entiendan su entorno y se adapten. Hasta Silicon Valley, que hasta entonces desconfiaba de la robótica social por las derrotas acumuladas, ve ahora una mina de oro que merece apostar fuerte, sin miedo al ridículo.

Los robots sociales no son solo ficción: Jibo y sus lecciones no tan fáciles

Cynthia Breazeal, del MIT Media Lab, presentó Jibo en 2014. Este robot social, sin brazos ni piernas ni cara, parecía una lámpara parlante que podía charlar y bailar para niños. Recaudó $3.7 millones en crowdfunding y consiguió 4,800 preórdenes. ¿Por qué falló? Porque tanta simpatía no bastaba para competir contra Siri o Alexa, que ya tenían el básico dominio del lenguaje aunque fueran aburridos y predecibles.

Jibo necesitaba entender y responder a las conversaciones con inteligencia real y sensibilidad contextual, no repetir guiones insípidos que lo hacían parecer un juguete roto. En esos años, las máquinas convertían el habla en texto, checaban palabras claves y respondían con frases pregrabadas, nada que pudiera moverse con gracia en una charla natural.

El boom de los grandes modelos de lenguaje en 2022 —sí, la llegada de ChatGPT— cambió la parrilla. Ahora, los robots pueden generar respuestas coherentes y creativas sobre la marcha, pero vienen con la trampa mortal: la imprevisibilidad. Ya algunos juguetes AI han soltado barbaridades al hablar con niños, desde teorías conspirativas hasta instrucciones peligrosas, un riesgo totalmente nuevo frente a las viejas respuestas fantasmales y controladas.

Jibo fue una visión adelantada para su tiempo, pero la tecnología del lenguaje no estaba lista para darle vida. Hoy, tantos intentos por replicar esa idea chocan con el mismo muro: la inteligencia conversacional útil es emocionante, pero también es un campo minado donde un error puede volverse viral.

Dactyl y la odisea del aprendizaje en simulación que roza la realidad

OpenAI entró al ring robótico en 2018 con Dactyl, una mano robótica digital entrenada para manipular cubos con letras y números, ofreciendo tareas que parecían sacadas de un geek de Rubik’s Cube: rotar el cubo para mostrar un lado predeterminado. El truco fue entrenarla casi exclusivamente en simulación, un ambiente controlado y manipulable.

Pero aquí está el gran problema: el mundo real se aferra a variaciones minúsculas pero fatales para un robot preparado con datos suaves de simulación. Los colores cambian, la textura cambia, la tensión del agarre cambia y, de repente, Dactyl se vuelve torpe y torpe en la vida real.

La solución pragmática fue “domain randomization”, o aleatorización del dominio. Imaginen un millón de mundos simulados, todos con pequeñas y azarosas diferencias: más o menos fricción, más o menos luz, colores alterados. Esa mezcla de caos artificial entrenó a Dactyl para adaptarse mejor a escenarios inesperados.

Esta técnica logró que Dactyl resolviera rubik’s a un 60% de eficacia general, y solo un 20% cuando el cubo estaba especialmente enrevesado. Nada como un humano, pero un milagro técnico para ese tiempo. ¿Y ahora? OpenAI cerró ese capítulo en 2021 —por ahora— pero según rumores vuelve con humanoides más ambiciosos.

Más allá del idealismo, este tira y afloja entre simulación y realidad define buena parte de la robótica hoy. No basta con entrenar en la pantalla, las máquinas deben absorber el caos físico del entorno real, y ahí está el nudo que las grandes firmas intentan desatar.

Google DeepMind y el arte de traducir órdenes humanas a hechos robóticos

Google DeepMind entró en 2022 con protones de revolución. Su RT-1 fue un modelo fundacional para robots capaz de procesar instrucciones de lenguaje natural y convertirlas en movimientos físicos, estableciendo un récord del 97% de éxito en tareas conocidas. Pero, y eso importa, también había un 76% de eficacia en acciones desconocidas para el sistema, un dato raramente resaltado porque apunta a la verdadera inteligencia: extrapolar.

¿Qué hicieron distinto? Durante 17 meses, capturaron en vídeo y con sensores a humanos haciendo 700 tareas cotidianas: abrir frascos, cargar bolsas, agarrar objetos. Catalogaron, tokenizaron y alimentaron todo eso a un modelo transformer, similar a los cerebros digitales detrás de GPT. El resultado fue un robot capaz de entender la relación entre instrucciones, imágenes y movimientos, una especie de traductor entre los comandos humanos y la ejecución mecánica.

Un año después lanzaron RT-2 con un giro excepcional: en vez de limitarse a datos específicos de robótica, se entrenó con miles de imágenes de internet, ampliando su capacidad de reconocer objetos y ubicarlos en el espacio con precisión. El robot pudo hacer cosas inimaginables antes, como “poner la lata de Coca-Cola cerca de la foto de Taylor Swift”, cruzando lenguaje, visión y acción en un mashup muy avanzado.

La evolución llegó rápido y en 2025 Google presentó Gemini Robotics, integrando aún más inteligencias, mejor entendimiento del lenguaje natural y mayor coordinación en entornos complejos. La apuesta es clara: dejar de lado los brazos aislados o los robots queridos por la ciencia ficción, para tener asistentes realmente útiles que adaptan su conducta a órdenes abstractas y contextos cambiantes.

Covariant y la promesa hecha realidad de robots que “trabajan contigo”

Antes de que OpenAI apagara la luz en su división robótica, un calderón de ingenieros independientes lanzó Covariant en 2017. ¿El objetivo? No uno de esos robots humo y espejos, sino uno que mueva cajas en almacenes, como cualquier empleado humano (excepto que no cobra ni protesta).

Covariant implementó un modelo parecido al de Google, utilizando datos reales de almacenes para crear un robot capaz de interactuar casi como un compañero de trabajo. Si le mostrabas una pila de pelotas de tenis, el robot aprendía a mover cada paquete a un lugar específico sin perder ni aplastar nada. Aquí no hay magia, hay miles de ojos, cámaras y sensores en cada instalación recogiendo datos que retroalimentan su inteligencia.

En pruebas recientes, el robot aún tropieza con instrucciones complicadas de “devolver la banana al lugar original”, confundiendo esponjas, manzanas y tratando múltiples objetos antes de acertar. “No entiende el concepto nuevo de ‘vuelta atrás’”, reconoció el cofundador Peter Chen, señalando que su desempeño depende mucho de la calidad y cantidad de información previa.

Covariant fue adquirido por Amazon, que ahora lo emplea en cerca de 1,300 almacenes solo en EEUU, lo cual hace pensar que esa “inteligencia de camarada” ya no es ciencia ficción. Pero sigue siendo un trabajo en progreso, porque los robots todavía deben aprender a comprender instrucciones complejas y flexibles con la naturalidad de un humano.

Digit y la odisea de los robots humanoides que cargan con todo (literalmente)

Digit, de Agility Robotics, no es un robot con cara bonita ni movimientos anestesiados por belleza estética. Expuesto, pragmático, con articulaciones a la vista y una cabeza que más parece un electrodoméstico futurista, Digit trabaja en Amazon, Toyota y GXO levantando cajas y armando pallets.

El sueño es claro: que los robots humanoides entren sin hacer remiendos ni adaptaciones de las líneas industriales, que entren en los mismos espacios que los humanos y hagan las tareas físicas con eficiencia y seguridad. Pero la realidad golpea duro: Digit sólo puede levantar 35 libras (unos 16 kilos), y cada mejora que le dan en fuerza le añade peso en baterías que lo obligan a recargar más seguido.

Además, las normas de seguridad para humanoides son mucho más estrictas que para brazos robotizados estáticos, porque estos robots se mueven cerca de personas, en ambientes impredecibles, y cualquier error podría ser caro o peligroso.

Aun así, Digit ejemplifica hacia dónde va la industria: una mezcla de simulaciones como las de OpenAI y modelos avanzados de Google, integrados para que el robot “aprenda en el campo”, en el lugar real, con sus imperfecciones y retos constantes.

Esta década está siendo la materia experimental donde se están probando casi todos los enfoques para un objetivo común: robots útiles, adaptativos, y no solo objetos de exhibición o gadgets costosos.

¿Un futuro promisorio o un espejismo costoso?

La robótica ha vuelto a la pista de despegue tras años de tropiezos enormes. Los modelos grandes de IA, la simulación con variación, el aprendizaje en terreno y la integración sensorial han redefinido qué es posible. Pero no hay atajos ni soluciones mágicas. Seguimos enfrentando un monstruo de complejidad, en que cada avance cuesta millones y lleva años de iteración (y a veces, fracaso).

El hype no puede nublar la realidad: los robots aún no viven entre nosotros como ayudantes silenciosos y eficientes, y los desafíos técnicos, económicos y éticos apenas están comenzando a revelarse. La cuestión importante es si estas cantidades astronómicas de inversión conseguirán, algún día cercano, robots que no solo imiten los movimientos humanos, sino que entiendan y actúen como compañeros realmente útiles.

¿O acabaremos con más juguetes caros e inútiles, otra vez? La humanidad espera. Y el reloj, como siempre, no para.

¿Confías tú en que los robots aprenderán a dejar de ser “de juguete” para ser colegas reales?

Artículos Relacionados

Por Helguera

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *