Este sitio web fue traducido automáticamente. Para obtener más información, por favor haz clic aquí.
  • Lexi Bogan, de 21 años, perdió la voz el verano pasado después de que los médicos le extirparan un tumor potencialmente mortal alojado cerca de la parte posterior del cerebro.
  • En abril, recuperó la voz mediante un clon generado por IA y entrenado con una grabación de 15 segundos de su voz adolescente.
  • Bogan y su equipo médico creen que tiene valiosas aplicaciones médicas para las personas con impedimentos o pérdidas del habla.

La voz que tenía Alexis "Lexi" Bogan antes del verano pasado era exuberante.

Le encantaba cantar baladas de Taylor Swift y Zach Bryan en el coche. Se reía todo el tiempo, incluso cuando acorralaba a los niños de preescolar que se portaban mal o debatía sobre política con sus amigos en la hoguera del patio trasero. En el instituto era soprano en el coro.

Entonces aquella voz desapareció.

LA INTELIGENCIA ARTIFICIAL AYUDA A PREDECIR NECESIDADES DE ASISTENCIA A LARGO PLAZO: "PRÓXIMOS PASOS CRÍTICOS

En agosto, los médicos le extirparon un tumor potencialmente mortal alojado cerca de la parte posterior del cerebro. Cuando le quitaron el tubo respiratorio un mes después, Bogan tenía problemas para tragar y se esforzaba por decir "hola" a sus padres. Meses de rehabilitación la ayudaron a recuperarse, pero sigue sin poder hablar. Amigos, desconocidos y sus propios familiares se esfuerzan por entender lo que intenta decirles.

Alexis Bogan

Alexis Bogan, cuyo habla se vio afectada por un tumor cerebral, utiliza una aplicación de smartphone con IA para crear un pedido de bebida audible en un autoservicio de Starbucks el 29 de abril de 2024, en Lincoln, Rhode Island. La aplicación convierte sus entradas mecanografiadas en un mensaje verbal creado con su voz original. (AP Photo/Steven Senne)

En abril, la joven de 21 años recuperó su antigua voz. No la real, sino un clon de voz generado por inteligencia artificial que puede invocar desde una aplicación de teléfono. Entrenada con una cápsula del tiempo de 15 segundos de su voz adolescente -procedente de un vídeo de demostración de cocina que grabó para un proyecto del instituto-, su voz sintética, pero con un sonido extraordinariamente real, puede ahora decir casi cualquier cosa que quiera.

Escribe unas palabras o frases en su teléfono y la aplicación las lee instantáneamente en voz alta.

"Hola, ¿me puede traer un café espresso con leche de avena y azúcar moreno?", dijo la voz de Bogan mientras sacaba el teléfono por la ventanilla del coche en un autoservicio de Starbucks.

LAS NUEVAS HERRAMIENTAS DE LA AI PUEDEN AYUDAR A LOS MÉDICOS A TOMAR NOTAS Y ENVIAR MENSAJES A LOS PACIENTES, PERO SIGUEN COMETIENDO ERRORES

Los expertos han advertido de que la tecnología de clonación de voz mediante IA, que mejora rápidamente, puede amplificar las estafas telefónicas, perturbar las elecciones democráticas y atentar contra la dignidad de las personas -vivas o muertas- que nunca consintieron que se recreara su voz para decir cosas que nunca dijeron.

Se ha utilizado para producir llamadas falsas a los votantes de New Hampshire imitando al presidente Joe Biden. En Maryland, las autoridades acusaron recientemente al director deportivo de un instituto de utilizar IA para generar un clip de audio falso del director del instituto haciendo comentarios racistas.

Pero Bogan y un equipo de médicos del grupo hospitalario Lifespan de Rhode Island creen haber encontrado una utilidad que justifica los riesgos. Bogan es una de las primeras personas -la única con su enfermedad- que han podido recrear una voz perdida con el nuevo Motor de Voz de OpenAI. Otros proveedores de IA, como la startup ElevenLabs, han probado una tecnología similar para personas con impedimentos y pérdida del habla, incluida una abogada que ahora utiliza su clon de voz en la sala del tribunal.

"Esperamos que Lexi sea una pionera en el desarrollo de la tecnología", dijo el Dr. Rohaid Ali, residente de neurocirugía de la facultad de medicina de la Universidad Brown y del Hospital de Rhode Island. Podrían beneficiarse millones de personas con derrames cerebrales debilitantes, cáncer de garganta o enfermedades neurogenerativas, afirmó.

"Debemos ser conscientes de los riesgos, pero no podemos olvidarnos del paciente y del bien social", dijo la Dra. Fatima Mirza, otra residente que trabaja en el piloto. "Podemos ayudar a devolver a Lexi su verdadera voz y ella puede hablar en los términos más fieles a sí misma".

Mirza y Ali, que están casados, llamaron la atención del fabricante de ChatGPT OpenAI por su anterior proyecto de investigación en Lifespan, en el que utilizaron el chatbot de IA para simplificar los formularios de consentimiento médico de los pacientes. La empresa de San Francisco se puso en contacto con ellos mientras buscaba, a principios de este año, aplicaciones médicas prometedoras para su nuevo generador de voz de IA.

Bogan seguía recuperándose lentamente de la operación. La enfermedad empezó el verano pasado con dolores de cabeza, visión borrosa y cara caída, lo que alarmó a los médicos del Hospital Infantil Hasbro de Providence. Descubrieron un tumor vascular del tamaño de una pelota de golf que le presionaba el tronco encefálico y enredaba vasos sanguíneos y nervios craneales.

"Fue una batalla conseguir controlar la hemorragia y sacar el tumor", dijo la neurocirujana pediátrica Dra. Konstantina Svokos.

La duración de 10 horas de la operación, unida a la localización y gravedad del tumor, dañó los músculos de la lengua y las cuerdas vocales de Bogan, impidiendo su capacidad para comer y hablar, dijo Svokos.

"Es casi como si me hubieran quitado una parte de mi identidad cuando perdí la voz", dijo Bogan.

Este año le quitaron la sonda de alimentación. Continúa la logopedia, que le permite hablar de forma inteligible en una habitación silenciosa, pero no hay indicios de que vaya a recuperar la plena lucidez de su voz natural.

"Llegó un momento en que empecé a olvidar cómo sonaba", dijo Bogan. "Me he acostumbrado mucho a cómo sueno ahora".

Cada vez que sonaba el teléfono en casa de la familia, en el suburbio de North Smithfield, en Providence, se lo pasaba a su madre para que atendiera las llamadas. Sentía que agobiaba a sus amigos cuando iban a un restaurante ruidoso. Su padre, que tiene pérdida de audición, se esforzaba por entenderla.

De vuelta al hospital, los médicos buscaban un paciente piloto para experimentar con la tecnología de OpenAI.

"La primera persona que se le ocurrió a la Dra. Svokos fue Lexi", dijo Ali. "Nos pusimos en contacto con Lexi para ver si le interesaba, sin saber cuál sería su respuesta. Estaba dispuesta a probarlo y ver cómo funcionaba".

Bogan tuvo que retroceder unos años para encontrar una grabación adecuada de su voz para "entrenar" al sistema de IA sobre cómo hablaba. Era un vídeo en el que explicaba cómo hacer una ensalada de pasta.

Sus médicos alimentaron intencionadamente el sistema de IA con sólo un clip de 15 segundos. Los sonidos de la cocina hacen que otras partes del vídeo sean imperfectas. También era todo lo que OpenAI necesitaba, una mejora respecto a la tecnología anterior, que requería muestras mucho más largas.

También sabían que conseguir algo útil en 15 segundos podía ser vital para los futuros pacientes que no tuvieran rastro de su voz en Internet. Podría bastar con un breve mensaje de voz dejado a un familiar.

Cuando lo probaron por primera vez, todos quedaron asombrados por la calidad del clon de voz. Los fallos ocasionales -una palabra mal pronunciada, una entonación perdida- eran casi imperceptibles. En abril, los médicos equiparon a Bogan con una aplicación telefónica personalizada que sólo ella puede utilizar.

"Me emociono mucho cada vez que oigo su voz", dijo su madre, Pamela Bogan, con lágrimas en los ojos.

"Creo que es increíble que pueda volver a tener ese sonido", añadió Lexi Bogan, diciendo que me ayudó a "aumentar mi confianza hasta algo donde estaba antes de que ocurriera todo esto".

Ahora utiliza la aplicación unas 40 veces al día y envía comentarios que espera que ayuden a futuros pacientes. Uno de sus primeros experimentos fue hablar a los niños de la guardería donde trabaja como profesora auxiliar. Tecleó "ja, ja, ja" esperando una respuesta robótica. Para su sorpresa, sonaba como su antigua risa.

Lo ha utilizado en Target y Marshall's para preguntar dónde encontrar artículos. Le ha ayudado a reconectar con su padre. Y le ha facilitado pedir comida rápida.

Los médicos de Bogan han empezado a clonar las voces de otros pacientes dispuestos de Rhode Island y esperan llevar la tecnología a hospitales de todo el mundo. OpenAI dijo que está actuando con cautela a la hora de ampliar el uso de Voice Engine, que todavía no está disponible públicamente.

Varias startups de IA más pequeñas ya venden servicios de clonación de voz a estudios de entretenimiento o los ponen a disposición del público. La mayoría de los proveedores de servicios de generación de voz dicen que prohíben la suplantación o el abuso, pero varían en la forma de hacer cumplir sus condiciones de uso.

"Queremos asegurarnos de que todas las personas cuya voz se utilice en el servicio den su consentimiento de forma continua", dijo Jeff Harris, responsable de OpenAI en el producto. "Queremos asegurarnos de que no se utiliza en contextos políticos. Así que hemos adoptado un enfoque muy limitado en cuanto a quién le damos la tecnología".

Harris dijo que el siguiente paso de OpenAI consiste en desarrollar una herramienta segura de "autenticación de voz" para que los usuarios sólo puedan replicar su propia voz. Eso podría ser "limitante para una paciente como Lexi, que ha perdido repentinamente la capacidad de hablar", dijo. "Así que pensamos que necesitaremos tener relaciones de alta confianza, especialmente con los proveedores médicos, para dar un acceso un poco más libre a la tecnología".

HAZ CLIC AQUÍ PARA OBTENER LA APLICACIÓN FOX NEWS

Bogan ha impresionado a sus médicos por centrarse en pensar cómo la tecnología podría ayudar a otras personas con impedimentos del habla similares o más graves.

"Parte de lo que ella ha hecho a lo largo de todo este proceso es pensar en formas de ajustar y cambiar esto", dijo Mirza. "Ha sido una gran inspiración para nosotros".

Aunque por ahora debe juguetear con su teléfono para que el motor de voz hable, Bogan imagina un motor de voz de IA que mejore los remedios antiguos para recuperar el habla -como la electrolaringe con sonido robótico o una prótesis de voz- al fundirse con el cuerpo humano o traducir palabras en tiempo real.

No está tan segura de lo que ocurrirá cuando envejezca y su voz de IA siga sonando como cuando era adolescente. Quizá la tecnología pueda "envejecer" su voz de IA, dijo.

Por ahora, "aunque no he recuperado totalmente la voz, tengo algo que me ayuda a encontrarla de nuevo", afirma.