Header Ads Widget

Ticker

6/recent/ticker-posts

Uso de API en ingeniería de sonido


 Las API han aportado una enorme capacidad de procesamiento y funcionalidad al mundo de la ingeniería y el diseño de sonido . Esta innovación, que utiliza una potente sinergia de hardware a software y soluciones basadas en navegador a través de la aplicación de API de presentación y diseño de sonido, es un aspecto a menudo pasado por alto de los hipermedia en la cultura emergente de Internet basada en los medios.

Veamos algunas API web orientadas al sonido, sus aplicaciones y el futuro de la industria. Daremos algunos ejemplos de cómo están cambiando el juego y cómo otros proveedores de API pueden beneficiarse al comprenderlos, considerarlos y posiblemente incluso implementarlos en aplicaciones web.

Reduciendo el campo

La ingeniería de sonido abarca tanto la grabación y producción de música tradicional como también ofertas altamente experimentales en manipulación de sonido, convergencia y conversión de archivos e incluso creación y diseño de instrumentos. Dicho esto, las API que vamos a discutir aquí se dividen en una de tres categorías:

  • Grabación de sonido : API que permiten la grabación de audio y la manipulación básica de datos de audio en una experiencia de navegador;
  • Manipulación de sonido : API que permiten una mayor manipulación de la señal de audio más allá de las API de "Grabación de sonido"; y
  • Experimental : API que no encajan en ninguno de los tres moldes establecidos anteriormente y, en cambio, proporcionan un marco para la implementación de audio altamente experimental y no tradicional.

Definiendo el DAW

Antes de profundizar demasiado en las soluciones que se ofrecen aquí, también debemos discutir un término clave de la industria que se utilizará en todas partes: DAW . La DAW, o estación de trabajo de audio digital, es un elemento clave de cualquier solución de ingeniería de sonido digital, ya que transfiere pistas de audio de los impulsos eléctricos generados por los instrumentos a pistas digitales que se pueden editar y manipular.

Hay una gama de DAW que se utilizan actualmente. El más popular, Pro Tools de Avid , es una interfaz optimizada que se utiliza en la mayoría de las configuraciones de audio profesionales, considerada el "estándar de la industria" para el trabajo de voz en off, la composición y la producción musical. Otras soluciones, como Logic Pro y Ableton, ofrecen una interfaz de grado "prosumidor" (un acrónimo de "profesional" y "consumidor"), que ofrece una DAW a un precio más bajo mientras sacrifica o simplifica algunas funciones.

Otros DAW, como ciertas versiones gratuitas de Cakewalk, Fruity Loops y Audacity, rara vez se usan en entornos profesionales, pero ofrecen una funcionalidad completamente gratuita a costa de asistencia técnica y modificaciones a través de complementos y otras herramientas similares.

Hay varios inconvenientes importantes en la configuración tradicional de DAW:

  • Estas herramientas (salvo las ofertas gratuitas) tienen un costo de entrada increíblemente alto, lo que requiere inversiones de cientos de dólares;
  • Los DAW se limitan al uso de computadoras de escritorio y portátiles; si bien se han logrado algunos avances para la edición basada en navegador y la grabación móvil, estos a menudo están vinculados a hardware específico y aún tienen que ofrecer una verdadera experiencia de DAW;
  • No existe una función de carga directa en la gran mayoría de productos que permita a los artistas compartir rebotes o raíces en Soundcloud, Bandcamp o medios de comunicación social;
  • Los DAW están vinculados directamente al procesamiento local y la potencia de la memoria de la máquina que aloja el DAW; y
  • La ayuda y el soporte técnico suelen ser limitados o inexistentes.

Eso no quiere decir que el concepto o incluso la aplicación común de la DAW sea necesariamente mala; después de todo, gran parte de la industria del entretenimiento se basa en una de estas herramientas mencionadas anteriormente. Sin embargo, lo que debería deducirse de esto es que las cosas pueden, y deben, hacerse mejor.

Lea también: Explorando el laboratorio en la nube: avances en biotecnología y ciencia como servicio

¿Por qué mover el DAW?

Está claro que la DAW debe cambiar porque, tal como está, lamentablemente no está preparada para el futuro de la ingeniería de audio profesional.

La progresión natural que siguen los servicios en la era moderna se aleja del procesamiento local. Hemos visto esto una y otra vez, específicamente en el movimiento de los servidores locales a las soluciones SaaS, PaaS e IaaS . Tome  Adobe Creative Cloud, o Google Drive, donde los archivos se dispersan y se hace accesible desde el dispositivo de cualquier usuario. Pixlr ahora es posible una potente edición de fotos basada en navegador  , que ofrece la mayoría de las funciones de Photoshop. 

La ingeniería de audio no es inmune a los cambios y, a medida que los profesionales adoptan soluciones de programación web y migración a la nube , las soluciones basadas en navegador podrían convertirse en la norma, en lugar de la excepción.

Parte de este cambio radical en el enfoque se debe a la eliminación de las limitaciones que durante mucho tiempo han restringido la viabilidad de las soluciones en la nube. Si bien las velocidades de las redes WiFi y de línea dura alguna vez fueron una preocupación, a medida que la verdadera Internet de alta velocidad se extiende por todo el mundo, esta preocupación se está mitigando en gran medida.

Grabación de sonido

Como cualquier músico puede decirle, el mundo de la grabación de audio está plagado de complejas interacciones de hardware y enormes interfaces de mezcla. Las señales de audio se llevan al entorno de producción utilizando interfaces enormes y descomunales, y luego se mezclan físicamente usando estaciones de trabajo gigantes o virtualmente usando estaciones de trabajo de audio digital complejas que requieren grandes cantidades de RAM y potencia de procesamiento para funcionar.

Al menos, ese era el mundo antes de la computación en la nube y las soluciones basadas en navegador. A medida que las API se han expandido en potencia y capacidad, las soluciones que alguna vez estuvieron relegadas solo a aplicaciones físicas y locales se han introducido lentamente en el navegador. Un gran ejemplo de este tipo de expansión de la funcionalidad en un espacio nunca antes considerado es Soundation .

Soundation es esencialmente una estación de trabajo de audio digital o DAW . Al aprovechar el poder del procesamiento del servidor y combinarlo con los recursos locales, Soundation puede proporcionar un DAW de calidad profesional, repleto de muestras, moduladores y efectos, todo con una aplicación basada en web que no se instala.

inundación

Fundación com - ejemplo de un DAW basado en navegador

Esto por sí solo debería demostrar el poder del entorno DAW basado en web impulsado por API, pero mejora. Si bien la API de Soundation es en gran parte interna y no está documentada, utiliza una API que es algo más pública y conocida: la API de Google Hangouts .

Esta API permite a los usuarios de Soundation colaborar en tiempo real utilizando no solo la funcionalidad de chat de texto de Google Hangouts, sino también el chat de video. Esto llena un gran vacío en el panorama de la ingeniería de sonido: la colaboración en vivo . Los DAW digitales son infinitamente portátiles, pero esencialmente reflejan los DAW físicos, lo que significa que el equipo debe transportarse, las versiones deben coincidir, los archivos de origen deben compilarse en un formato estándar, incluso dentro de diferentes versiones de la misma aplicación, y así sucesivamente. .

Soundation es increíblemente poderoso debido a cómo cierra distancias: los usuarios utilizan una aplicación web simple para crear contenido y colaborar en tiempo real , como si estuvieran al lado de un compañero músico usando el mismo DAW.

Este es un gran paso y una gran ventaja de una potente API. Del mismo modo, Soundation utiliza otras API de terceros de manera efectiva, lo que permite que el contenido se cargue en redes sociales como YouTube, Soundcloud y Facebook. La forma en que Soundation utiliza estas API debería ser un criterio para otros desarrolladores y es una demostración perfecta de lo lejos que han llegado las soluciones basadas en navegador.

Es de destacar el borrador de trabajo de WebRTC del W3C. Si bien las aplicaciones como Soundation permiten la colaboración en tiempo real utilizando API de terceros, esta solución está diseñada para aprovechar el poder de la especificación abierta para permitir la comunicación del navegador en tiempo real fuera de las API limitadas de terceros.

Manipulación de sonido

Una parte integral del concepto de grabación de sonido es la manipulación de sonido : la adición de efectos a un archivo de audio, como reverberación, retardo, coro, distorsión, compresión y otros.

La manipulación es diferente a la grabación. Por un lado, las aplicaciones de grabación de sonido tienden a centrarse más en la provisión de una señal de línea de base limpia para garantizar que los datos capturados para rastrear sean lo más claros posible. Estas aplicaciones dependen de la entrada de datos externos, por lo que esta entrada debe ser lo más limpia, con la menor latencia y lo más inalterada posible.

En consecuencia, gran parte de la tecnología dentro de las aplicaciones de grabación de sonido que se enfoca en la manipulación del sonido tiende a enfocarse en la manipulación de este audio de línea de base dentro de los límites del sonido original. En otras palabras, quieren manipular, digamos, una señal de guitarra, mientras mantienen el hecho de que de hecho es una señal de guitarra.

La manipulación del sonido en esta clase tiende a depender de la reverberación, el eco, a veces la inversión y la ecualización para alcanzar la tonalidad deseada. Pero la manipulación del sonido puede ser mucho más expansiva. Las herramientas dentro de este rango incluyen cosas como bit crushing, que reduce la tasa de bits del audio para generar sonidos "chiptune" o "mecánicos", cortes múltiples, que toma la misma muestra y aplica un rango rítmico de efectos para crear un ritmo, y otros extrañas herramientas de sonido y generadores.

manipulación de sonido

Audiotool - microservicios para efectos de audio

Un gran ejemplo de esto es Audiotool . Audiotool es una estación de trabajo de manipulación de audio con todas las funciones que se basa en un concepto nodular de herramientas y generadores de sonido. Si bien puede cargar sus propias muestras y utilizar la API interna para modularlas, el poder real de esta herramienta viene con las formas de onda preformadas y los sintetizadores y emuladores incluidos, cada uno usando una API interna para aprovechar la potencia del servidor para crear dinámicas y complejas. sonidos.

Piense en Audiotool como un emulador para el suelo en un estudio de música. Los generadores, moduladores, ecualizadores paramétricos, sintetizadores, bucles y otros equipos similares están esparcidos en un espacio de trabajo vacío, conectados mediante cables que se pueden arrastrar. Estas herramientas son editables e interconectables, lo que permite la generación de sonido creativa.

Al igual que Soundation, Audiotool también se vincula con una variedad de API que permiten compartir en su propia plataforma interna, SoundCloud, Youtube y Facebook.

Relacionado: Aprenda a diseñar API de medios teniendo en cuenta la negociación de contenido

Experimental

Sin embargo, el mundo de las API de audio no está solo en el ámbito de la grabación y la remezcla. Al igual que con cualquier tecnología emergente, las API de ingeniería de sonido han desarrollado brotes adicionales de las aplicaciones principales que están mejor ubicadas en una categoría amplia denominada simplemente "experimental".

Muchos de los mejores ejemplos de este tipo de uso de API experimental se pueden encontrar en la API de audio web de Chrome . Esta API expande enormemente la funcionalidad de audio del navegador y abre un montón de funciones posibles que de otro modo no estarían disponibles.

Un gran ejemplo de esto es el sitio Infinite Gangam Style . Utilizando la API de Web Audio, esta aplicación analiza el audio y lo divide en "beats" de componentes individuales. Cuando estos latidos se cotejan y comparan, los vecinos más cercanos se encuentran y se vinculan intrínsecamente con un "umbral de similitud" específico.

Lo que esto significa esencialmente es que el sitio genera una versión infinita de "Gangnam Style", vinculando ritmos similares con otros ritmos similares y creando nuevos pasajes a partir de nuevas combinaciones de ritmos y bucles.

Haciendo eco de parte del poder de las otras soluciones de grabación y manipulación de sonido, otro gran ejemplo aquí es Tibersynth , un sintetizador de sonido que utiliza la vectorización para generar ruido. Utilizando la API de Web Audio bajo una interfaz codificada en Raphael.js, el sintetizador es esencialmente un dispositivo de entrada mapeado por el controlador que genera un tono de ruido blanco.

nube de clúster

Tibersynth

Lo importante aquí no es necesariamente lo que tibersynth es ahora, ya que aún se encuentra en sus primeras etapas, sino lo que representa: la sintetización de audio interactiva impulsada por la entrada vectorial es algo bastante difícil de hacer en hardware, pero hacerlo de manera tan efectiva y poderosamente en una solución de navegador es sorprendente.

Quizás el mejor ejemplo del poder experimental aquí es el Graphical Filter Editor , un sitio web que le permite utilizar una muestra de sonido y dibujar un filtro gráfico en tiempo real, editando las cualidades paramétricas de un archivo de sonido. En un momento, este tipo de cosas tomó un banco completo de dispositivos de hardware EQ, mientras que ahora, solo toma una página web. Ese es el poder de las API en ingeniería de sonido.

Si bien a primera vista esto puede parecer desconectado del concepto profesional de ingeniería de sonido, se deben considerar las posibles aplicaciones que ofrecen este tipo de soluciones. La página InfiniteGangnam, por ejemplo, proporciona un algoritmo con el que un ingeniero puede desarrollar sonidos ambientales y música en bucle para aplicaciones como videojuegos y diseño web . El editor GraphicalFilter es un maravilloso ejemplo de una solución independiente que podría implementarse fácilmente en un servicio que permita una transcripción de audio y una conversión de texto a voz más claras a través del filtrado dinámico de ruido.

Este tipo de soluciones, con el tiempo, se volverán menos "experimentales" y más "aplicadas", pero gran parte del poder de estas soluciones experimentales aún no se ha desbloqueado realmente.

Producción de sonido programable futura

Esta no es de ninguna manera una discusión exhaustiva: el poder del campo API de audio de sonido emergente aún no se ha visto y aprovechado por completo. Lo que esto es, sin embargo, es un vistazo a un mundo que rara vez se discute cuando se consideran las API, y que lamentablemente es poco apreciado por músicos y diseñadores de sonido en todas partes.

Publicar un comentario

0 Comentarios