La compañía está desarrollando una alternativa en formato de audio aún más comprimido
Meta continúa en la construcción de su metaverso y para eso necesita crear un entorno funcional en un escenario que puede ser cambiante según las disponibilidades del usuario. Uno de sus trabajos recientes está en la consolidación de un formato de audio mucho más comprimido que MP3.
Desde hace casi 30 años este tipo de archivo se ha consolidado como el preferido de Internet, porque permite una gran calidad sin ocupar un espacio muy grande, lo que es ideal para navegaciones inestables o para permitir un uso ideal de la web sin problemas de carga.
Lo que está haciendo la empresa de Mark Zuckerberg es crear un códec de hipercompresión de audio, que permita la misma calidad del MP3 pero con un tamaño mucho más pequeño, ideal para no afectar la navegación de las personas en diferentes plataformas.
Nuevo formato de audio
Para llevar a acabo este desarrollo Meta se está apoyando de la inteligencia artificial para entrenar a redes neuronales y que entiendan la manera en la que se construye el audio, luego sea recreado y reproducirlo con la misma calidad, pero con un menor espacio al original.
“Conseguimos una tasa de compresión de aproximadamente 10 veces en comparación con el MP3 a 64 kbps, sin pérdida de calidad. Si bien estas técnicas ya se han explorado para el habla, somos los primeros en hacerlas funcionar para audio estéreo muestreado a 48 kHz (es decir, con calidad de CD), que es el estándar para la distribución de música”, informó la compañía.
El funcionamiento de este proceso se realiza en tres pasos, para tomar el audio y llevarlo a un formato de menor tamaño:
– El codificador toma los datos sin comprimir y los transforma en una representación de mayor dimensión y menor velocidad de cuadro.
– El cuantificador, comprime esta representación al tamaño que se proponemos. Este paso cuenta con un entrenamiento para que proporcione el tamaño deseado, conservando la información más importante para reconstruir la señal original. Esta representación comprimida es la que se almacena en el disco o se envía a través de la red. Es el equivalente al archivo .mp3.
– El decodificador es el último paso. Aquí se vuelve a convertir la señal comprimida en una forma de onda lo más parecida posible al original.
Todo este proceso permite “comprimir y descomprimir el audio en tiempo real con reducciones de tamaño de última generación”, con lo que buscan varios objetivos, como crear llamadas más rápidas y mejorar las condiciones al estar conectados a redes deficientes, además de entregar experiencias más cómodas en el metaverso sin requerir grandes conexiones.
De momento, Meta aseguró que está enfocada en el audio, por lo que este proceso a través de inteligencia artificial no está enfocado en video, pero sí es el comienzo para mejorar las condiciones en formatos como videollamadas, streaming de películas y videojuegos de realidad virtual.
Esto también conllevaría a que los chips de audio y video de los teléfonos y computadores tengan que ser mejorados al adaptarse a esta tecnología, lo que les permitirá consumir menos energía.
“Queremos seguir explorando cómo podemos comprimir el audio a tamaños de archivo aún más pequeños sin degradar significativamente la calidad. También tenemos previsto explorar la compresión de audio espacial, lo que requerirá una técnica que pueda comprimir varios canales de audio manteniendo una información espacial precisa. Estos aprendizajes podrían ser útiles para futuras experiencias del metaverso”, informó Meta.