Tecnología
Un altavoz inteligente permite activar o silenciar zonas de conversación en una habitación
Funciona con pequeños micrófonos independientes, que navegan por el espacio y reconocen las voces de los hablantes
Pablo Javier Piacente
Un sistema de altavoz inteligente emplea un “enjambre” de diminutos micrófonos que se despliegan en forma independiente por una habitación, detectando las voces de las personas presentes. La tecnología aplicada se combina con algoritmos de aprendizaje profundo, permitiendo a los usuarios silenciar ciertas áreas o separar conversaciones simultáneas, incluso si dos personas que están cerca tienen voces similares. Los diminutos micrófonos robóticos se ubican únicamente mediante el sonido, sin la necesidad de cámaras o imágenes.
Investigadores de la Universidad de Washington y la empresa Microsoft, en Estados Unidos, han desarrollado un “enjambre” acústico robótico que, junto con redes neuronales artificiales, separa y localiza con alta precisión pequeños micrófonos que navegan por una habitación en forma independiente. El sistema de altavoz inteligente permite silenciar ciertas zonas o activar otras, en función de las necesidades de cada usuario en un momento determinado.
Sonido inteligente
Si nos encontramos en una sala repleta de gente y cerramos los ojos, nos es imposible diferenciar el discurso de cada persona o identificar dónde se encuentra exactamente cada una de ellas en la habitación. Esto es extremadamente difícil de procesar para el cerebro humano, pero el nuevo sistema de altavoz inteligente parece lograrlo. "Por primera vez, utilizando lo que llamamos un “enjambre acústico robótico”, podemos rastrear las posiciones de varias personas que hablan en una habitación y separar su discurso", indicó en una nota de prensa Malek Itani, autor principal del nuevo estudio.
Según describen los científicos en los resultados de su investigación, publicada recientemente en la revista Nature Communications, el sistema permite localizar y controlar el sonido, aislando por ejemplo a una persona que habla desde un lugar específico en una habitación llena de gente, sin señales visuales provenientes de cámaras. Solamente emplea la información acústica y la procesa mediante algoritmos de aprendizaje profundo.
La “flota” de micrófonos robóticos, cada uno de aproximadamente una pulgada de diámetro, parte automáticamente desde una estación de carga y se distribuye por el espacio. Esto permite que el sistema se mueva entre diferentes entornos y se configure en forma independiente, captando y separando las voces de los hablantes. Cuando es necesario por cuestiones de energía, los micrófonos regresan a la estación de carga.
El sistema permite silenciar o concentrarse en el habla de una región específica en una sala llena de gente. Créditos: Paul G. Allen School / YouTube.
Amplia diversidad de aplicaciones
A medida que se mueven desde su cargador, cada pequeño micrófono robótico emite un sonido de alta frecuencia, similar a los que emplean los murciélagos para ubicarse, utilizando esta señal y otros sensores para evitar obstáculos. El despliegue automático permite que los dispositivos se coloquen solos con máxima precisión, facilitando un mejor control del sonido que si los colocara una persona.
El equipo de especialistas realizó pruebas en oficinas, salas de estar y cocinas, con grupos de tres a cinco personas hablando. En todos estos entornos, el sistema podía discernir diferentes voces a una distancia de 50 centímetros entre sí con un 90% de efectividad, sin información previa sobre la cantidad de hablantes.
Las aplicaciones de este sistema de altavoz inteligente son múltiples. En una reunión en una sala de conferencias, por ejemplo, se podría implementar un sistema de este tipo en lugar de un micrófono centralizado, lo que permitiría un mejor control del audio en el recinto.
Por último, los investigadores creen que a medida que avance la tecnología se podrían implementar enjambres acústicos en viviendas inteligentes, para diferenciar mejor a las personas que hablan con parlantes inteligentes. Por ejemplo, mediante un sistema de este tipo las personas sentadas en un sofá, ubicadas en una “zona activa”, podrían controlar vocalmente un televisor u otros dispositivos.
Referencia
Creating speech zones with self-distributing acoustic swarms. Malek Itani, Tuochao Chen, Takuya Yoshioka and Shyamnath Gollakota. Nature Communications (2023). DOI:https://doi.org/10.1038/s41467-023-40869-8
- Los usuarios del transporte público en Mallorca lo tienen claro: 'Que hagan lo que quieran, pero tiene que seguir siendo gratis
- Monumental atasco en la nueva Vía de Cintura de Palma de cuatro carriles
- El magnate financiero danés y mayor terrateniente de Banyalbufar, Kim Fournais: «Banyalbufar no ha de ser un nuevo Deià, debe conservar su espíritu»
- La Aemet avisa de la llegada de una nueva borrasca este domingo: así afectará a Mallorca
- Retiran unas cámaras de videovigilancia tras la denuncia de los padres del colegio Robert Graves de Deià
- Consulta el programa del Año Nuevo Chino que se celebra en Palma
- Alquileres disparados en Palma: anuncia una habitación por 900 euros al mes para dos personas
- Las señales de tráfico en Palma, objetivo de los ladrones: 'Es el nuevo cobre