Texto publicado por SUEÑOS;

Ingeñeria;

Robótica.

Robot aprendiendo de su contacto con humanos.

Los robots industriales convencionales de hoy en día, como los de las
cadenas de montaje de automóviles, no tienen nada que merezca ser llamado
cerebro; sólo tienen memoria. Un operador programa el robot para que realice
los pasos necesarios para la acción deseada; entonces, el robot puede
repetir exactamente los mismos pasos cada vez que se le presenta el mismo
trabajo.

Pero fuera de la cadena de montaje, las cosas se complican: Un robot
personal que trabaje en un hogar tiene que manejar los huevos con mayor
suavidad que las latas de conservas. Si tiene que coger y usar un cuchillo
de cocina afilado, debe ser lo bastante inteligente como para mantener la
hoja alejada de las personas de su entorno.

El equipo de Ashutosh Saxena y Ashesh Jain, de la Universidad Cornell en
Ithaca, Nueva York, Estados Unidos, decidió enseñar a un robot humanoide y
lo bastante inteligente a trabajar de cajero en un supermercado. Los
experimentos no se hicieron en un supermercado abierto al público, sino en
una sala habilitada como supermercado pero con acceso restringido.

El robot escogido fue uno del modelo Baxter, creado por la empresa Rethink
Robotics de Boston. Este modelo está diseñado para trabajar en una cadena de
montaje de una fábrica, pero los robotistas de la Universidad Cornell lo
modificaron para adecuarlo mejor a su nuevo oficio.

Al robot se le puede enseñar a hacer cosas de la manera que es tradicional
en la robótica: Programándolo mediante software a fin de que mueva sus
brazos del modo deseado para que haga un determinado trabajo manual.

Pero también es posible enseñarle a hacer cosas de una manera comparable a
cómo un humano podría enseñarle a otro. El robot dispone de una modalidad de
aprendizaje en la que un humano puede por ejemplo tomar su mano robótica y
guiarla en el movimiento adecuado, cuando el robot ha comenzado a hacer algo
y lo está haciendo mal. Esto permite a cualquier humano, sin necesidad de
ser robotista ni de tener un conocimiento profundo sobre el robot, enseñarle
de manera muy directa cómo debe y cómo no debe hacer algo. El robot por su
parte memoriza la corrección y la aplica. Por ejemplo, si el robot coge un
cuchillo blandiéndolo con la hoja hacia su entorno y moviéndolo deprisa
podría herir accidentalmente a alguien que estuviera cerca. En su trabajo
como cajero, eso podría ocurrir si un cliente compra un cuchillo de cocina y
el robot lo coge para contabilizar su precio y luego al ir a dejarlo al otro
lado lo acerca peligrosamente al cliente. Si alguien le enseña al robot que
un cuchillo o cualquier objeto con forma parecida debe ser movido despacio,
alejado lo más posible de las personas de su entorno y con la hoja vuelta
hacia él en vez de hacia los humanos, el robot lo hará así a partir de
entonces.

Arriba: Ian Lenz, a la izquierda, y Ashesh Jain, con el robot. Abajo: Con
varias articulaciones, un robot del modelo Baxter se puede mover con mayor
flexibilidad que una persona, pero para un humano sería difícil decidir la
mejor manera de usar esos brazos, por lo que el robot está programado para
que planifique sus propios movimientos y permita luego que las personas le
hagan correcciones. (Foto: Cornell U.)

La opción que permite corregir al robot y hacer que aprenda se basa en lo
que los investigadores llaman modo de "gravedad cero", en el que el robot
mantiene sus brazos en posición pero sin ofrecer resistencia cuando el
operador los mueve. A medida que el robot ejecuta sus movimientos, el
operador puede intervenir, guiando los brazos para corregir la trayectoria.
La primera corrección puede que no sea la mejor, pero sí un poco mejor. El
algoritmo de aprendizaje con que los investigadores dotaron al robot le
permite aprender de forma incremental, perfeccionando su trayectoria un poco
más cada vez que el humano le corrige. Incluso con correcciones incompletas
pero en su conjunto cada vez más cerca del ideal buscado, el robot logra
finalmente realizar un movimiento óptimo en la situación de interés.

Con esa y otras estrategias parecidas, estos robotistas están ayudando a los
robots (y también a los humanos que deban trabajar con robots) a colaborar
juntos del mejor modo posible, en una estrategia llamada "aprendizaje
coactivo".

El robot aprende a asociar una trayectoria particular con cada tipo de
objeto. Un movimiento rápido aunque sea algo rudo puede ser perfecto para
mover una caja de cereales y aprovechar así mejor el tiempo, pero no lo
sería para una docena de huevos. Como los huevos son frágiles, al robot se
le enseña que debe cogerlos y moverlos con suavidad y despacio. Asimismo, el
robot aprende que los objetos afilados como el cuchillo no se deben mover
cerca de personas ni de forma abrupta; debe moverlos despacio, mantenerlos
cerca de él mientras los mueve, y en el caso del cuchillo tener la hoja
vuelta hacia él en vez de hacia las personas.

En las pruebas con usuarios que no formaban parte del equipo de
investigación, la mayoría de ellos entrenaron con éxito al robot en una
tarea particular con sólo cinco correcciones de realimentación. Los robots
fueron capaces de generalizar lo que habían aprendido de los humanos.