Software de edicion y manipulación del audio

Embed Size (px)

Citation preview

Software de edicin y manipulacin del audio digital

NDICE DE MATERIAS 1-Introduccin 2-Editor de audio digital 3-Multipistas de audio digital 4-Secuenciador MIDI / audio

IntroduccinCuando hablamos de herramientas de edicin y manipulacin del audio digital nos estamos refiriendo, sin duda alguna, a todas aquellas aplicaciones en forma de software, y en cierta medida hardware, que nos permiten alterar las cadenas de 0 y 1 que forman el audio digital. En la prctica existen muchas aplicaciones de la tecnologa del audio digital que nada tienen que ver con composicin / produccin de msica. Aunque slo nos referiremos a estas ltimas, el audio digital se aplica actualmente en tecnologa de telefona mvil, sonares, radares, exploracin del espacio, reduccin de reunidos en los coches ("anulacin" del audio por inversin de fase), aplicaciones mdicas, psicologa, etc. slo por citar un ejemplo de lo ms variado. Centrmonos en el dominio de la msica, nuestra ambicin. En nuestro caso, las necesidades son el poder, en primer lugar, registrar y almacenar audio digital, alterar los datos almacenados y reproducirlos. Si bien el primer escaln y ltimo son realmente exactos (grabar y reproducir no conlleva confusin alguna), "alterar los datos grabados" incluye todo un abanico de funciones, manipulaciones y procesos donde la imaginacin es slo el limite. Hablamos de la edicin / proceso de audio digital, que puede ser destructiva (el archivo se procesa y se altera) o a tiempo real (se calcula el resultado a medida que va sonando y el archivo no se modifica) Un software que tratase el audio debiera, en primer lugar capturar el audio. Existen muchas aplicaciones informticas shareware que permiten hacer eso, pero en el entorno profesional o home studio se delimitan muy claramente los tipos de aplicaciones y sus usos:

Editor de audio digital (Editor Wave)En este grupo englobaremos todas las aplicaciones que permiten grabar, importar / exportar y manipular audio digital de forma muy extensa sin incluir funciones de mezcla y produccin musical. Esto significa que el programa no posee la capacidad de reproduccin de mltiples pistas de forma simultnea con un mezclador asociado en el que poder realizar la mezcla y ecualizacin de dichas pistas. Un buen editor de audio debe poder abrir muchos formatos de archivo. Aunque en el mundo del PC se utilizan, bsicamente, los formatos "wav" y "AIFF" y en Mac "snd II" y tambin "AIFF", existen muchos otros formatos dedicados a la multimedia en general (audio para Internet, juegos, codificacin, compresin, etc..) y sobretodo formatos de audio de hardware externo al ordenador como grabadores de audio digital autnomos o samplers (sintetizadores que utilizan muestras de audio digital como ondas para sus osciladores). Los samplers suelen incluir una unidad de discos, conector SCSI e incluso unidades ZIP. Las muestras utilizadas por stos pueden ser cargadas y abiertas por un editor de audio que posea la habilidad de leer esos datos. Esto amplia enormemente las posibilidades del sampler ya que podemos suplir las carencias de ste (por ejemplo, si nuestro sampler es barato y posee una pobre edicin de audio) con la ayuda de un editor de audio. El sampler es un instrumento electrnico ampliamente utilizado, el porcentaje de usuarios de un editor de audio que poseen un sampler es muy elevado. Es normal que los editores de audio tengan en cuenta este dato. Existen muchos samplers que no poseen unidad de discos y para stos se ofrecen opciones de importacin de archivos mediante volcados MIDI (una tcnica extremadamente lenta) o transferencias va SCSI.

Cuadro de dilogo de la transmisin de audio digital va MIDI / SCSI de Sound Forge 5.0

Kurzweil K-2000 el sintetizador / sampler referido en el grfico anterior

En cuando a la edicin del audio, la gran mayora de las funciones son destructivas, es decir alteran los datos originalmente grabados, eso s, ofrecen historial de procesos "Undo" (Deshacer) con lo que recuperar las distintas versiones del audio. Gran parte de la edicin de los editores de audio se basa en procesos utilizados en el proceso de masterizacin, es decir la creacin del archivo master final. Estas herramientas son procesos de ecualizacin, dinmica y dithering mayoritariamente. El dither es un sistema de reduccin del ruido y distorsin producido por el truncamiento de bits (al pasar de 24 a 16 bits) o incluso en pasajes de msica en que se utilizan menos bits para representar la seal (msica clsica con baja dinmica por ejemplo). El dither aade un tipo de ruido que elimina el ruido "aliasing" automticamente. Se incluyen, naturalmente, otros procesos no tan comunes en la masterizacin, como pueden ser efectos tipo reverberacin, todo tipo de retardos (delay) y efectos de modulacin (chorus, flanger, wha-wha, ensemble) y reduccin de la calidad (distorsin y reduccin de bits). Cabe destacar que los algoritmos de los procesos destructivos (no a tiempo real) deben tener ms calidad que los procesos a tiempo real ya que no existe una exigencia de rapidez de proceso pues el resultado no debe entregarse a tiempo real. Por otro lado, al ser procesos destructivos, los editores de audio suelen incluir utilidades de proceso y conversin por lotes, es decir, poder listar "x" archivos de audio, seleccionar los procesos a aplicar y que el programa se encargue del resto mientras nos vamos a cenar...Otro aspecto importante son las funciones de medicin, anlisis y estadsticas del audio. A parte de mostrar espectrogramas del audio (representaciones del audio dependiendo de la amplitud y frecuencias).

Sound Forge mostrando su anlisis de frecuencias de un archivo de audion (izquierda) y un sonograma del mismo (derecha)

El eje horizontal muestra las frecuencias, y el vertical la amplitud (nivel) de stas, es decir que visualizamos la amplitud de cada frecuencia y eso nos dice la "cantidad" de graves, medios y agudos del audio. Como el audio es un evento que se sucede en el tiempo, el anlisis de "x" tiempo de audio dara como resultado espectrograma en cascada que nos indicar las variaciones de la amplitud (lase volumen) de las frecuencias en el tiempo. El espectrograma utiliza el modelo de anlisis de Fourier. Existen variaciones como el sonograma que muestra el contenido de frecuencias en forma de colores formando sorprendentes grficos.

La espectacular grfica 3D de WaveLab 3.0 generada a partir de la amplitud de las frecuencias en el tiempo. Las estadsticas de audio nos indican el volumen mximo y mnimo del audio, volumen medio, duracin, picos mximos, desviaciones del eje 0 (DC-Offset), etc. Existen funcionalidades extra que pueden ayudar en el mundo del video. Por ejemplo, extraer el audio de una pelcula digital, procesarlo (o sustituirlo) y volver a montar la pelcula final. Otra funcionalidad extra (aunque anteriormente muy utilizada, antes de la aparicin de los secuenciadores MIDI / audio) son las listas de reproduccin. Creando regiones (marcando fragmentos del audio y dndoles un nombre) para posteriormente situar su orden de reproduccin en una lista virtual. Esta funcin se combina con la capacidad del programa para sincronizarse a cdigo de tiempo SMPTE, lo cual es imprescindible para sincronizar el audio a video externo. Tambin resaltar las funciones de exportacin del audio. En ese sentido las opciones son muy completas aunque destaca una curiosidad...los codificadores mp3 suelen pagarse, es decir suelen ser opciones extra con un precio extra (aunque valen lo mismo que una buena cena para dos). El resultado obtenido con stos es superior a los codificadores mp3 shareware que se encuentran en Internet, como por ejemplo el popular algoritmo Fraunhofer IIS.

La ltima funcionalidad propia de estas aplicaciones es tambin el ltimo proceso en el largo camino de creacin de un disco; la creacin del CD. Aunque existen varias aplicaciones shareware que permiten crear un CD de audio, los editores incluyen edicin de las pistas del CD grfica utilizando formas de onda en las que podemos crear fundidos de volumen de entrada y salida entre otras avanzadas funciones, aunque no tan centradas como un software de creacin de CD de pago, como por ejemplo Get it On CD de Steinberg que ofrece la posibilidad de crear CD en todos los formatos disponibles incluyendo, naturalmente, CD de audio.

WaveLab3.0 mostrando dos pistas de una grabacin a CD Existe un grupo muy pequeo de editores de audio dedicados a procesos muy concretos. Podemos hablar de aplicaciones de restauracin de audio como Clean 3.0 tambin de Steinberg (programas que slo se dedican a recuperar la calidad del audio suprimiendo artefactos y ruidos), creacin y edicin de loops rtmicos (entindase loops como fragmentos de audio de varios compases exactos fcilmente manipulables) como ReCycle de Propellerhead, entre otros.

Clean 3.0 dedicado por enteroa la restauracin de audio

Puedes encontrar ms informacin en esta misma web, en la seccin Productos

Sound Forge de Sonic Foundry (izquierda) y WaveLab de Steinberg (derecha)

Multipistas de audio digitalLos multipistas de audio son aquellas aplicaciones que permiten grabar, manipular y mezclar audio digital. Estos programas pueden reproducir varios archivos de audio de forma simultnea, es decir, al mismo tiempo en forma de pistas. Por esta razn, los archivos de audio de la cancin deben poseer el mismo formato (mismos kHz y bits) aunque existe un grupo de programas muy selecto que realiza una conversin de archivo a tiempo real en el caso de que los archivos posean un formato distinto. En las pistas el audio se dispone en forma de regiones o clips de audio, que son una representacin virtual de un fragmento del audio del disco duro. Es posible repetir de forma muy sencilla y rpida estos fragmentos, aplicarles curvas de volumen y construir, en general, un nuevo "arreglo" de la cancin mediante la reestructuracin de los fragmentos. Las pistas estn asociadas a un mezclador que permite la produccin de audio y mezclas. Cada pista posee un canal en dicho mezclador en el que se puede ajustar el volumen, panorama, ecualizacin, insertar efectos (plug-ins en distintos formatos) etc... La mezcla se realiza a tiempo real lo cual supone que son aplicaciones muy exigentes con el ordenador, consumen muchos ms recursos que un editor de audio (baste decir que Sound Forge 4.0 puede funcionar en un 486 a 66Mhz y 32 Mb de memoria RAM). Un multipistas de audio requiere una tarjeta de audio profesional que aparte de una buena calidad de audio posea un chip DSP que acelere la gestin y trasmisin del audio liberando al ordenador de esta tarea. Estas tarjetas suelen incluir un tipo de drivers (controladores por software del hardware) muy especial con tiempos de latencia (tiempo de respuesta de las ordenes de audio) muy bajos. Existen drivers tipo ASIO (de Steinberg, cdigo abierto), EASI (de Emagic, muy similar a ASIO), DAE (de Digidesign, un "super-driver" que incluye todo el manejo del motor DSP de Pro Tools) y E-WDM (de Ego-Sys, un formato que mejora el nuevo WDM o Windows Model Driver de Microsoft. Este formato es muy nuevo y todava no ha cuajado en la comunidad de programadores). Estos drivers deben ser proporcionados por los fabricantes de las tarjetas de audio profesionales, siendo el mas comn, sin duda alguna y con diferencia el formato ASIO (ASIO 2.0 en la actualidad). Los drivers multimedia normales (insuficientes en el mundo de los multipistas y secuenciadores MIDI) son los llamados MME o Microsoft Multimedia Extensions y Direct X. Los multipistas de audio incluyen una breve edicin de audio, es decir, algunas funciones propias de un editor de audio que suelen ser destructivas. No poseen, sin embargo, funciones de importacin / exportacin de muestras va MIDI o SCSI, herramientas de anlisis o listas de reproduccin (para eso ya tiene las propias pistas de audio, cada pista es en realidad una lista de reproduccin). Las funciones de procesado de volumen, dinmica y efectos se calculan de forma independiente por cada pista aunque la mesa virtual suele incluir subbuses, envos y retornos de efectos tanto internos (por software) como externos (utilizando las entradas y salidas de la tarjeta, para lo cual sta debe poseer mltiples entradas y salidas de audio). El proceso de los efectos puede ser de dos tipos (que pueden combinarse entre s)

Motorola DSP legendario

56002,

modelo

El moderno Motorola DSP frances Dream tipo multimedia empleado DSP56301 empleado por casi en la conocida tarjeta ISIS todos los fabricantes

DSP a 32 bits de Analog Devices empleado en los sistemas Pulsar

DSP de consumo empleado en la tarjeta ISIS y algn modelo antiguo de Midiman

1. Proceso por DSP fsico: Los efectos son procesados por chips DSP ubicados en tarjetas PCI especificas, el ejemplo clsico es Pro Tools, un excelente software acompaado de una potente tarjeta con 6, 12 o 18 chips DSP ampliable. En este caso el ordenador solamente gestiona los grficos del programa y realiza un control exhaustivo de todos los procesos, pero en ningn caso requiere una ingente cantidad de recursos (lase Mhz de velocidad de proceso). Los efectos DSP existen porqu un mismo fabricante desarrolla el hardware (la tarjeta DSP) y el software, lo cual supone una dependencia hacia ese fabricante. No obstante esta es la solucin ms profesional, sin duda alguna. En la actualidad hay varios formatos de plug-ins por DSP que encontrars en la tabla inferior. 2. Proceso nativo: Los efectos nativos son los ms comunes y no requieren una tarjeta PCI con chips DSP especifica. Utilizan la CPU del ordenador, (Pentium, G4, etc..) para calcular los efectos a tiempo real. En este caso, el ordenador debe realizar lo mismo que antes (grficos y control de las funciones) y todos los clculos del audio (mezcla, efectos) lo cual requiere una gran cantidad de recursos, pero evita depender de un nico fabricante. Existen varios formatos de plug-ins nativos.

Tabla 1: Tipos de formatos de plug-ins

Proceso NativoVST EASI DirectX (DX) MAS Si Si Si Si

por DSPNo No No No

PC MacSi Si Si No Si Si No Si

ComentarioDe Steinberg, el estndar nativo actual De Emagic, slo incluido en Logic Audio Estndar de Microsoft. De MOTU y utilizado por Digital Performer

RTAS HTDM TDM SoundScape Pulsar / SCOPE

Si Si No No No

No No Si Si Si

Si Si Si Si Si

Si Si Si No Si

De Digidesign y slo funciona con hardware y software Digidesign Nuevo formato, sustituye a RTAS? El primer estndar por DSP fsico. Slo funciona con hardware Digidesign De Soundscape y slo funciona con hardware y software Soundscape De Creamware, funciona con todos los programas

En la actualidad, las mesas virtuales de estos programas son tan sofisticadas y complejas que en muchos casos requieren el uso de una superficie de control hardware par poder aprovechar todas sus ventajas (como la automatizacin, la capacidad de grabar cada control manipulado en el tiempo para su posterior reproduccin). Para ello, estn apareciendo una gran cantidad de mesas "de control" que no mezclan el audio, sino que controlan la mezcla del programa. Un buen multipista de audio debera poseer capacidad de mezcla Surround (otra cosa es que pueda codificar en Surround). La mezcla Surround incluye la posibilidad de manejar los envos a efectos Surround (o efectos por software con varias entradas y salidas de audio). Para la simulacin del Surround los programas utilizan las mltiples salidas de audio de la tarjeta si sta no posee varias salidas no podrs conectar ms de 2 altavoces, verdad?). Este es un listado con las soluciones ms utilizadas: Puedes encontrar ms informacin en esta misma web, en la seccin Productos

Nuendo y su matriz de efectos master con el codificador Surround (derecha)

Secuenciador MIDI / audio digitalSi un software multipistas de audio es una aplicacin exigente con la potencia del ordenador, el secuenciador es un devorador de recursos todava ms implacable. Esto es en parte porque un secuenciador MIDI / audio debe poseer la funcionalidad de un multipistas de audio ms la funcionalidad de todo un secuenciador MIDI, que no es poco. Los datos MIDI son mucho ms pequeos que los datos de audio, es decir, es mucho ms exigente el clculo de una reverberacin a tiempo real que no una cuantizacin o transposicin MIDI a tiempo real por ejemplo. El problema real es la estabilidad de la sincronizacin entre el audio digital y el MIDI, dos mundos muy distintos. Baste con decir que un segundo de audio se divide en 44.100 "casillas" mientras que la resolucin de un secuenciador es mucho menor. Un secuenciador requiere una buena tarjeta de audio, al igual que el multipista de audio digital, pero adems requiere un buen interface MIDI que ayude al ordenador en la gestin y transmisin de datos MIDI. Se utilizan los mismos tipos de drivers que en los multipistas de audio ya que la exigencia de rendimiento es la misma o superior.

Interface MIDI AMT-8 de Emagic, con 8 entradas y 8 salidas MIDI

Interface UM-2 y UM4 de Roland

En este enlace encontrars informacin muy amplia sobre todos los tipos de interfaces MIDI: http://www.laorejadigital.com/help/interface_midi.php3 (ver en la seccin "Campos de bsqueda). Sin entrar en toda la funcionalidad MIDI, destacaremos que un buen secuenciador MIDI es aqul programa que permite tanto a los usuarios que poseen conocimientos musicales como los que no, crear y producir msica. Para ello se disponen de varias pantallas en las que la informacin grabada se presenta en formatos como una partitura, una lista de eventos en el tiempo, una matriz tipo pianola, entre otros. Los secuenciadores incluyen una sencilla edicin de audio, es decir que tambin participan de la funcionalidad de un editor de audio aunque sin ofrecer ese grado de profundidad. Como siempre, la edicin de estos editores es destructiva. Las pistas de audio estn asociadas a un mezclador virtual DSP del mismo modo que en los multipistas de audio y toda la mezcla se realiza a tiempo real.

Cubase VST el ms famoso y tambin el ms vendido

Logic Audio el sofisticado secuenciador alemn

Cakewalk SONAR el famoso secuenciador americano

MIDIMAN Delta 1010, ejemplo de tarjeta con 10 entradas y 10 salidas y drivers ASIO

La popular tarjeta Pulsar con efectos por DSP (izquierda). Incluye 6 chips DSP a 32 bits, dos entradas y dos salidas analgicas y conexiones digitales. A su derecha, la tarjeta DSP de Pro-Tools con 6 DSP Motorola a 24 bits y 100Mhz