Cómo se entrenan robots de IA para actuar como humanos en el mundo real

Desarrollo de IA en el mundo físico

Cómo se entrenan robots de IA para actuar como humanos en el mundo real

05/11/2025 | 17:27

La inteligencia artificial ha dominado el mundo digital, pero ahora necesita aprender a moverse en el mundo físico. Un equipo global de entrenadores está trabajando en esta tarea.

Redacción Cadena 3

La inteligencia artificial (IA) ha logrado dominar casi todas las actividades que realizamos en línea, pero ahora enfrenta un nuevo desafío: aprender a moverse en el mundo físico. Para ello, un creciente ejército de entrenadores está ayudando a que la IA escape de las pantallas y se integre en nuestros hogares, oficinas y fábricas, enseñándole cómo se mueve un ser humano.

En una ciudad industrial del sur de India, Naveen Kumar, de 28 años, se prepara para su jornada laboral: debe doblar toallas de mano cientos de veces, con la mayor precisión posible. Sin embargo, no trabaja en un hotel, sino para una startup que crea datos físicos utilizados para entrenar a la IA.

Kumar monta una cámara GoPro en su frente y sigue una lista rigurosa de movimientos de manos para capturar imágenes en primera persona de cómo un humano dobla una toalla. Su tarea del día consiste en recoger cada toalla de una canasta a su derecha, utilizando solo la mano derecha, sacudirla con ambas manos para que quede recta y luego doblarla cuidadosamente tres veces. Finalmente, debe colocar cada toalla doblada en la esquina izquierda de su escritorio. Si tarda más de un minuto o se salta algún paso, debe comenzar de nuevo.

Su empresa, una compañía de etiquetado de datos llamada Objectways, envió 200 videos de doblado de toallas a su cliente en Estados Unidos. La compañía cuenta con más de 2,000 empleados; aproximadamente la mitad se dedica a etiquetar datos de sensores de automóviles autónomos y robótica, mientras que el resto trabaja en IA generativa.

La mayoría de ellos son ingenieros, y pocos tienen experiencia en doblar toallas, por lo que se turnan para realizar este trabajo físico. "A veces tenemos que eliminar casi 150 o 200 videos debido a errores tontos en cómo estamos doblando o colocando los objetos", comentó Kumar, un graduado en ingeniería que ha trabajado en Objectways durante seis años.

Estos movimientos cuidadosamente coreografiados buscan capturar todas las sutilezas de lo que hacen los humanos: brazos que se extienden, dedos que agarran, telas que se deslizan para doblar la ropa. Los videos capturados son luego anotados por Kumar y su equipo, quienes dibujan cuadros alrededor de las diferentes partes del video, etiquetan las toallas y señalan si el brazo se movió a la izquierda o a la derecha, clasificando cada gesto.

Kumar y sus colegas en la ciudad de Karur, a unos 480 kilómetros al sur de Bengaluru, son un grupo poco convencional de tutores para la próxima generación de robots impulsados por IA. "Las empresas están construyendo modelos fundamentales adecuados para el mundo físico", afirmó Ulrik Stig Hansen, cofundador de Encord, una plataforma de gestión de datos en San Francisco que contrata a Objectways para recopilar datos de demostración humana. "Hay un gran resurgimiento en la robótica".

Encord trabaja con empresas de robótica como Physical Intelligence, respaldada por Jeff Bezos, y Dyna Robotics. Entre los líderes en EE.UU. en la carrera por desarrollar la próxima generación de robots se encuentran Tesla, Boston Dynamics y Nvidia. Tesla ya utiliza sus robots Optimus, que parecen ser controlados a distancia, para diferentes eventos de la empresa. Google tiene sus propios modelos de IA para robótica, y OpenAI está fortaleciendo sus ambiciones en este campo.

Nvidia proyecta que el mercado de robots humanoides podría alcanzar los 38,000 millones de dólares en la próxima década. Además, hay muchas empresas menos conocidas que intentan proporcionar el hardware, software y datos necesarios para hacer realidad un robot humanoide multitarea y producido en masa.

Los modelos de lenguaje que alimentan chatbots como ChatGPT han dominado el uso del lenguaje, imágenes, música, programación y otras habilidades al absorber todo lo que hay en línea. Utilizan toda la internet para entender cómo están conectadas las cosas y emular cómo hacemos las cosas, como responder preguntas y crear videos fotorealistas.

Sin embargo, obtener datos sobre cómo funciona el mundo físico, como la fuerza necesaria para doblar una servilleta, es más complicado y difícil de traducir en algo que la IA pueda utilizar. A medida que la robótica mejora y se combina con IA que sabe cómo moverse en el mundo físico, podría haber más robots en el lugar de trabajo y en el hogar. Mientras muchos temen que esto pueda llevar a pérdidas de empleo y desempleo, los optimistas creen que los robots avanzados liberarían a los humanos de trabajos tediosos, reducirían los costos laborales y, eventualmente, darían a las personas más tiempo para relajarse o concentrarse en trabajos más interesantes e importantes.

Muchas empresas han entrado en la carrera como vendedores de palas en la fiebre del oro de la IA, viendo una oportunidad para recopilar datos para lo que se denomina IA física. Un grupo de empresas está enseñando a la IA cómo actuar en el mundo real mediante la guía remota de humanos a los robots.

Ali Ansari, fundador de Micro1, con sede en San Francisco, comentó que la recopilación de datos de robótica emergente se centra cada vez más en la teleoperación. Los humanos con controladores hacen que el robot realice tareas como recoger una taza o preparar té. La IA recibe videos de intentos exitosos y fallidos de realizar una tarea y aprende a hacerlo.

El entrenamiento a control remoto puede realizarse en la misma habitación que los robots o con el controlador en un país diferente. Hansen, de Encord, mencionó que se están planeando almacenes en Europa del Este donde grandes equipos de operadores se sentarán con joysticks, guiando robots en todo el mundo.

Estos "granjas de brazos" están proliferando a medida que aumenta la demanda, dijo Mohammad Musa, fundador de Deepen AI, una empresa de anotación de datos con sede en California. "Hoy en día, se utiliza una mezcla de datos reales y sintéticos, recopilados de demostraciones humanas, sesiones de teleoperación y entornos escenificados", explicó. "Gran parte de este trabajo aún se realiza fuera de Occidente, pero la automatización y la simulación están reduciendo esa dependencia con el tiempo".

Algunos han criticado a los humanoides teleoperados por ser más espectáculo que sustancia. Pueden ser impresionantes cuando otros los controlan, pero aún están lejos de ser completamente autónomos. La empresa Micro1 también realiza algo llamado captura de datos humanos. Paga a las personas para que usen gafas inteligentes que capturan acciones cotidianas. Esto se está llevando a cabo en Brasil, Argentina, India y Estados Unidos.

Figure AI, con sede en San José, se ha asociado con el gigante inmobiliario Brookfield para capturar imágenes dentro de 100,000 hogares. Recopilará datos sobre el movimiento humano para enseñar a los robots humanoides cómo moverse en espacios humanos. La compañía afirmó que gastará gran parte de los 1,000 millones de dólares que recaudó para recopilar datos humanos en primera persona.

Scale AI, respaldada por Meta, ha recopilado 100,000 horas de metraje de entrenamiento similar para robótica a través de su laboratorio prototipo establecido en San Francisco.

Aún así, entrenar a los robots no siempre es fácil. Dev Mandal, de 20 años, creó una empresa en Bengaluru, con la esperanza de aprovechar la necesidad de datos físicos para entrenar a la IA. Ofreció la mano de obra barata de India para capturar movimientos. Tras publicitar sus servicios, recibió solicitudes para ayudar a entrenar un para cocinar alimentos, así como un robot para enchufar y desenchufar cables en centros de datos.

Sin embargo, tuvo que abandonar el negocio, ya que los clientes potenciales necesitaban que los datos de movimiento físico se recopilaran de una manera muy específica, lo que dificultaba que él ganara dinero, incluso con la mano de obra barata de India. Los clientes querían un brazo robótico exacto, por ejemplo, utilizando un tipo de mesa con luces moradas que debían usarse.

"Todo, hasta el color de la mesa, tenía que ser especificado por ellos", dijo. "Y dijeron que este tiene que ser el color exacto".

Aún así, hay mucho trabajo para los dobladores de toallas de Karur. Su jefe, el fundador de Objectways, Ravi Shankar, mencionó que en los últimos meses, su empresa ha capturado y anotado metraje de brazos robóticos doblando cajas de cartón y camisetas, así como seleccionando objetos de ciertos colores en una mesa. Recientemente, comenzó a anotar videos de robots humanoides más avanzados, ayudándoles a clasificar y doblar una mezcla de toallas y ropa, doblándolas y colocándolas en diferentes esquinas de la mesa. Su equipo tuvo que anotar 15,000 videos de los robots realizando estas tareas.

"A veces los brazos del robot lanzan la ropa y no doblan correctamente. Otras veces, desparraman la pila", pero los robots están aprendiendo rápidamente, comentó Kavin, un empleado de Objectways que se presenta solo con ese nombre. "En cinco o diez años, podrán hacer todos los trabajos y no quedará ninguno para nosotros".

Lectura rápida

¿Qué están haciendo los robots de IA?
Los robots de IA están siendo entrenados para realizar tareas físicas similares a las humanas, como doblar toallas.

¿Quién está involucrado en este proceso?
Entrenadores humanos, como Naveen Kumar, trabajan para empresas como Objectways para recopilar y anotar datos.

¿Cuándo se lleva a cabo este entrenamiento?
El proceso de entrenamiento ocurre actualmente, con un enfoque creciente en la teleoperación y la recopilación de datos.

¿Dónde se realiza este trabajo?
El trabajo se realiza en lugares como Karur, India, y en empresas de tecnología en EE.UU.

¿Por qué es importante este proceso?
Es crucial para desarrollar robots que puedan interactuar de manera efectiva en el mundo físico y realizar tareas cotidianas.

Te puede Interesar

Estudio revela desigualdades en el acceso a tecnología

Un nuevo estudio revela que casi la mitad de los australianos ha utilizado IA generativa, pero el acceso varía según la edad, educación y ubicación, lo que podría profundizar desigualdades sociales y económicas.

Impacto de la IA en el empleo

En cinco meses, Amazon y Microsoft anunciaron la eliminación de más de 29,000 puestos de trabajo. La IA y la reestructuración organizativa son factores clave en esta decisión.

Competencia de robótica en Teherán

En las Olimpíadas Tecnológicas de Irán, estudiantes de ingeniería exhibieron sus habilidades en robótica, inteligencia artificial y más, a pesar de las limitaciones impuestas por las sanciones internacionales.

Investigación de la EPFL

Investigadores de la EPFL crearon un sensor electrónico basado en fibra que funciona estirándose más de diez veces su longitud original, ideal para textiles inteligentes y robótica.

© Copyright 2025 Cadena 3 Argentina