/ lunes 19 de julio de 2021

Evolución | ¿Harto de las videollamadas? La IA las hará más reales

Las empresas están buscando alternativas para que las videollamadas pierdan esa sensación de aburrimiento y de mala calidad

Después de 16 meses, prender la computadora y conectarse a una plataforma de videollamadas se convirtió en un proceso que ya resulta insoportable para muchos.

Las apps de reuniones virtuales han tenido crecimientos estratosféricos por la necesidad de mantener el contacto para las reuniones de trabajo, así como ver a familiares y amigos.

Sólo en septiembre del año pasado, Zoom registró más de 46.2 millones de descargas, una cifra récord para la empresa.

Pero el aburrimiento también está presente en el uso de estas herramientas.

Sin embargo, las empresas buscan alternativas para que las videollamadas pierdan esa sensación de aburrimiento.

Una de estas compañías es Nvidia. La Inteligencia Artificial (IA) desarrollada por los investigadores de la empresa permite a los usuarios encender la laptop, conectarse a la reunión y lucir una imagen limpia y perfecta sin necesidad de quitarse la pijama.

Vid2Vid Cameo, es uno de los modelos utilizados por la tecnología deep learning, que forma parte del programa SDK de Nvidia Maxine, especializado en videoconferencias.

El aplicativo del programa permite generar una especie de máscara en segunda dimensión que refleja imágenes realistas de cabezas parlantes.

“Eso significa que un asistente a una reunión con el cabello desarreglado y la pijama puesta puede aparecer como si estuviera vestido con una camisa formal, mientras la IA mapea los movimientos faciales del usuario con una foto previamente cargada del individuo, con un atuendo apropiado para el trabajo. Si el sujeto está mirando hacia la izquierda, la tecnología puede ajustar el punto de vista para que el asistente parezca estar haciendo contacto visual con la cámara web”, señala la compañía.

Foto: Reuters 

Además, un tema constante en las reuniones es quedarse trabado durante la junta, ante la necesidad de una conexión más poderosa, pero Nvidia asegura que esta técnica de IA también reduce el ancho de banda necesario para las videoconferencias hasta en 10 veces, lo que evita el retraso en la recepción de la imagen.

“Muchas personas tienen un ancho de banda de Internet limitado, pero aun así quieren tener una videollamada sin problemas con amigos y familiares", dijo Ming-Yu Liu, coautor del proyecto. "Además de ayudarlos, esta tecnología también podría usarse para ayudar al trabajo de animadores, editores de fotos y desarrolladores de juegos".

Vid2Vid Cameo requiere dos elementos para crear una cabeza parlante de IA realista para videoconferencias: una toma de la apariencia de la persona y una transmisión de video que dicta cómo se debe animar esa imagen.

Para su desarrollo, los investigadores utilizaron un conjunto de datos de 180 mil videos de cabezas parlantes de alta calidad.

La red aprendió a identificar 20 puntos clave que se pueden utilizar para modelar el movimiento facial sin anotaciones humanas.

Pero Nvidia no es la única empresa que experimenta con la Inteligencia Artificial y la Realidad Aumentada.

Otra Big Tech que se subió a este tipo de proyectos es Google, a través de un dispositivo que no logró el éxito esperado: Google Lens.

Los lentes que integran una cámara de video y una pantalla en los cristales frente a los ojos cambió su objetivo y ahora se puede utilizar en la app Google Meet.

La empresa californiana señaló que todos los clientes de Workspace podrán pedir usar Google Meet a través de su dispositivo Glass en un programa que todavía está en fase de pruebas, pero que ya es funcional.

El uso industrial de los lentes permite a los usuarios ver información virtual sobre objetos reales, como los requerimientos para el mantenimiento de equipos industriales. Los lentes permiten ver instrucciones escritas directamente en la línea de visión, sin distracciones.

El objetivo de este nuevo programa es permitir que las personas puedan hacer una videollamada en Google Meet sin distraerse de otras actividades, por lo que podría ser muy útil para solicitar ayuda o comentarios sobre un problema técnico.

La desarrolladora de software, TeamViewer, también lanzó una app de videollamadas con realidad aumentada. LifeAR es un servicio de videoconferencias, aunque su función se parece más a la de una red social, que a una aplicación de juntas virtuales.

A través de ella, dice la empresa, se puede recibir ayuda en tiempo real para solucionar problemas técnicos y hasta consultar la opinión de otras personas para realizar compras.

Foto: Reuters 

COMUNICACIÓN CON HOLOGRAMAS

La red 5G también permite mejorar las imágenes en tercera dimensión, al punto que ya es posible proyectar hologramas de personas tan realistas que parecen estar atrapadas en las pantallas.

El dispositivo Portl, distribuido por la empresa catalana Newtonlab Space, permite proyectar contenidos en 3D y transmitirlos en directo con resolución 4K en cualquier parte del mundo gracias al empleo de la tecnología 5G.

Equipado con un fondo blanco, una cámara y dos altavoces, el sistema permite a los usuarios interactuar con el holograma en tiempo real, lo que abre un universo de utilidades en el mundo educativo, sanitario y empresarial, entre otros.

Eduard Martín, director de 5G de Mobile World Capital Barcelona, evento donde se realizó el lanzamiento mundial de la imagen, aseguró que el dispositivo ya está al servicio de las empresas con el objetivo de lograr "telepresencias", es decir, simular de la forma más verídica posible "que alguien está presencialmente".

"El holograma es 3D, tiene volumen y sombra. Es una reproducción bastante fidedigna", ha destacado al compararlo con la "imagen plana" que ofrece una videollamada.

Según Martín, este tipo de soluciones "evolucionarán mucho" en los próximos años, ya que pueden combinarse con "realidades virtuales e inmersivas", especialmente en el campo de la educación y la sanidad.

Foto: Reuters 

"Hay muchísimas posibilidades", ha resaltado, por su parte, el director creativo de Newtonlab Space, Roger Belso, quien ha asegurado que en el mundo corporativo puede servir para realizar charlas o presentaciones, así como conciertos y espectáculos en el ámbito artístico e incluso pases de moda o escaparates en el retail.

Microsoft va un paso más allá, al tener un proyecto que no sólo pretende digitalizar tu imagen, sino la oficina completa, a través del aplicativo Mesh.

La empresa estadounidense anunció que la plataforma permitirá que personas que están en lugares distintos se encuentren virtualmente en forma de un holograma con su aspecto físico.

Mesh está construida sobre el servicio de computación en nube de la compañía, Azure, y ofrece una interfaz de lo que en Microsoft han bautizado como "realidad mixta", es decir, a medio camino entre la realidad aumentada y la virtual (la primera superpone elementos al entorno físico, mientras que la segunda crea un entorno totalmente artificial).

"Puedes sentir que estás en el mismo lugar que otra persona y te puedes teletransportar desde distintos aparatos para estar presente con otra gente aunque no estén físicamente juntos", indicó en la presentación el socio técnico de Microsoft, Alex Kipman.

La presentación de Mesh corrió a cargo de Kipman, quien apareció como un holograma en la conferencia de desarrolladores Ignite de la compañía, que se desarrolló de forma virtual en marzo de este año.

La plataforma de realidad mixta estará disponible tanto en los dispositivos de realidad aumentada de Microsoft, los HoloLens 2, como en computadoras, tabletas, teléfonos inteligentes y auriculares de realidad virtual de otras marcas.

La empresa también informó de que en el futuro integrará Mesh a sus servicios para las empresas, Teams y Dynamics 365, con el objetivo de que esta tecnología pueda usarse para el trabajo remoto.

Después de 16 meses, prender la computadora y conectarse a una plataforma de videollamadas se convirtió en un proceso que ya resulta insoportable para muchos.

Las apps de reuniones virtuales han tenido crecimientos estratosféricos por la necesidad de mantener el contacto para las reuniones de trabajo, así como ver a familiares y amigos.

Sólo en septiembre del año pasado, Zoom registró más de 46.2 millones de descargas, una cifra récord para la empresa.

Pero el aburrimiento también está presente en el uso de estas herramientas.

Sin embargo, las empresas buscan alternativas para que las videollamadas pierdan esa sensación de aburrimiento.

Una de estas compañías es Nvidia. La Inteligencia Artificial (IA) desarrollada por los investigadores de la empresa permite a los usuarios encender la laptop, conectarse a la reunión y lucir una imagen limpia y perfecta sin necesidad de quitarse la pijama.

Vid2Vid Cameo, es uno de los modelos utilizados por la tecnología deep learning, que forma parte del programa SDK de Nvidia Maxine, especializado en videoconferencias.

El aplicativo del programa permite generar una especie de máscara en segunda dimensión que refleja imágenes realistas de cabezas parlantes.

“Eso significa que un asistente a una reunión con el cabello desarreglado y la pijama puesta puede aparecer como si estuviera vestido con una camisa formal, mientras la IA mapea los movimientos faciales del usuario con una foto previamente cargada del individuo, con un atuendo apropiado para el trabajo. Si el sujeto está mirando hacia la izquierda, la tecnología puede ajustar el punto de vista para que el asistente parezca estar haciendo contacto visual con la cámara web”, señala la compañía.

Foto: Reuters 

Además, un tema constante en las reuniones es quedarse trabado durante la junta, ante la necesidad de una conexión más poderosa, pero Nvidia asegura que esta técnica de IA también reduce el ancho de banda necesario para las videoconferencias hasta en 10 veces, lo que evita el retraso en la recepción de la imagen.

“Muchas personas tienen un ancho de banda de Internet limitado, pero aun así quieren tener una videollamada sin problemas con amigos y familiares", dijo Ming-Yu Liu, coautor del proyecto. "Además de ayudarlos, esta tecnología también podría usarse para ayudar al trabajo de animadores, editores de fotos y desarrolladores de juegos".

Vid2Vid Cameo requiere dos elementos para crear una cabeza parlante de IA realista para videoconferencias: una toma de la apariencia de la persona y una transmisión de video que dicta cómo se debe animar esa imagen.

Para su desarrollo, los investigadores utilizaron un conjunto de datos de 180 mil videos de cabezas parlantes de alta calidad.

La red aprendió a identificar 20 puntos clave que se pueden utilizar para modelar el movimiento facial sin anotaciones humanas.

Pero Nvidia no es la única empresa que experimenta con la Inteligencia Artificial y la Realidad Aumentada.

Otra Big Tech que se subió a este tipo de proyectos es Google, a través de un dispositivo que no logró el éxito esperado: Google Lens.

Los lentes que integran una cámara de video y una pantalla en los cristales frente a los ojos cambió su objetivo y ahora se puede utilizar en la app Google Meet.

La empresa californiana señaló que todos los clientes de Workspace podrán pedir usar Google Meet a través de su dispositivo Glass en un programa que todavía está en fase de pruebas, pero que ya es funcional.

El uso industrial de los lentes permite a los usuarios ver información virtual sobre objetos reales, como los requerimientos para el mantenimiento de equipos industriales. Los lentes permiten ver instrucciones escritas directamente en la línea de visión, sin distracciones.

El objetivo de este nuevo programa es permitir que las personas puedan hacer una videollamada en Google Meet sin distraerse de otras actividades, por lo que podría ser muy útil para solicitar ayuda o comentarios sobre un problema técnico.

La desarrolladora de software, TeamViewer, también lanzó una app de videollamadas con realidad aumentada. LifeAR es un servicio de videoconferencias, aunque su función se parece más a la de una red social, que a una aplicación de juntas virtuales.

A través de ella, dice la empresa, se puede recibir ayuda en tiempo real para solucionar problemas técnicos y hasta consultar la opinión de otras personas para realizar compras.

Foto: Reuters 

COMUNICACIÓN CON HOLOGRAMAS

La red 5G también permite mejorar las imágenes en tercera dimensión, al punto que ya es posible proyectar hologramas de personas tan realistas que parecen estar atrapadas en las pantallas.

El dispositivo Portl, distribuido por la empresa catalana Newtonlab Space, permite proyectar contenidos en 3D y transmitirlos en directo con resolución 4K en cualquier parte del mundo gracias al empleo de la tecnología 5G.

Equipado con un fondo blanco, una cámara y dos altavoces, el sistema permite a los usuarios interactuar con el holograma en tiempo real, lo que abre un universo de utilidades en el mundo educativo, sanitario y empresarial, entre otros.

Eduard Martín, director de 5G de Mobile World Capital Barcelona, evento donde se realizó el lanzamiento mundial de la imagen, aseguró que el dispositivo ya está al servicio de las empresas con el objetivo de lograr "telepresencias", es decir, simular de la forma más verídica posible "que alguien está presencialmente".

"El holograma es 3D, tiene volumen y sombra. Es una reproducción bastante fidedigna", ha destacado al compararlo con la "imagen plana" que ofrece una videollamada.

Según Martín, este tipo de soluciones "evolucionarán mucho" en los próximos años, ya que pueden combinarse con "realidades virtuales e inmersivas", especialmente en el campo de la educación y la sanidad.

Foto: Reuters 

"Hay muchísimas posibilidades", ha resaltado, por su parte, el director creativo de Newtonlab Space, Roger Belso, quien ha asegurado que en el mundo corporativo puede servir para realizar charlas o presentaciones, así como conciertos y espectáculos en el ámbito artístico e incluso pases de moda o escaparates en el retail.

Microsoft va un paso más allá, al tener un proyecto que no sólo pretende digitalizar tu imagen, sino la oficina completa, a través del aplicativo Mesh.

La empresa estadounidense anunció que la plataforma permitirá que personas que están en lugares distintos se encuentren virtualmente en forma de un holograma con su aspecto físico.

Mesh está construida sobre el servicio de computación en nube de la compañía, Azure, y ofrece una interfaz de lo que en Microsoft han bautizado como "realidad mixta", es decir, a medio camino entre la realidad aumentada y la virtual (la primera superpone elementos al entorno físico, mientras que la segunda crea un entorno totalmente artificial).

"Puedes sentir que estás en el mismo lugar que otra persona y te puedes teletransportar desde distintos aparatos para estar presente con otra gente aunque no estén físicamente juntos", indicó en la presentación el socio técnico de Microsoft, Alex Kipman.

La presentación de Mesh corrió a cargo de Kipman, quien apareció como un holograma en la conferencia de desarrolladores Ignite de la compañía, que se desarrolló de forma virtual en marzo de este año.

La plataforma de realidad mixta estará disponible tanto en los dispositivos de realidad aumentada de Microsoft, los HoloLens 2, como en computadoras, tabletas, teléfonos inteligentes y auriculares de realidad virtual de otras marcas.

La empresa también informó de que en el futuro integrará Mesh a sus servicios para las empresas, Teams y Dynamics 365, con el objetivo de que esta tecnología pueda usarse para el trabajo remoto.