¿Qué es un codec?

Al comenzar cualquier proyecto audiovisual una de las primeras decisiones técnicas que hay que tomar es en qué formato capturar las imágenes. Dentro de esa decisión está el tipo de cámara que voy a utilizar para ello y al decidir el tipo de cámara, tengo que decidir simultáneamente qué “codec” voy a utilizar. O puede ser que la cámara que se vaya a utilizar esté determinada por el tipo de “codec” que quiero utilizar. Para poder elegir el “codec” correcto tengo que tener en cuenta el flujo de trabajo completo hasta el momento de realizar la copia Master final. 

Pero qué es exactamente un ”codec”. Codec es un acrónimo compuesto por las palabras en inglés “compressor-decompressor” y apunta entonces a la forma en que la información digital va a ser comprimida y descomprimida, codificada y decodificada, haciendo que el tamaño del archivo sea mucho menor y más manejable que las imágenes sin compresión o crudas (RAW).

Esto permite que el flujo de trabajo pueda ser mucho más manejable por las capacidades computacionales de las distintas estaciones de trabajo involucradas durante todo el proceso, pero también puede presentar problemas potenciales si no se tiene en cuenta las características del determinado codec a utilizar. 

La codificación del material registrado es un proceso técnico que cada codec maneja de forma distinta y por lo tanto tiene finalidades y usos distintos. Existen los codecs utilizados para la reproducción optimizada en internet, como el H264, que logra reducir el tamaöo de los archivos considerablemente para el uso efectivo del ancho de banda disponible del usuario en Internet, con una decente calidad de imagen, que hace que sea el codec preferido para intercambiar archivos a través de la red. 

Los mismos fabricantes de cámaras como por ejemplo Canon o Sony utilizan codecs propios para la captura de la imagen con la menor pérdida de calidad posible. Es entonces cuando usamos por ejemplo el Codec XAVC-I de sony o el XFAVC de Canon.

Otros codecs conocidos y ampliamente usados durante todo el proceso de postproducción y también para la copia Master del producto es el ProRes, desarrollado por Apple y viene en distintos «sabores» dependiendo de la relación calidad / tamaöo de archivo que se busque. De modo que hay un ProRes “proxie”, utilizado para procesos de edición offline, ProRes LT y el ProRes422 HQ qué es el preferido para la duplicación de Masters, ó el de más alta calidad el ProRes4444 que conserva toda la información de color de la imagen y es el preferido para procesos de correción de color o efectos visuales, si no se quiere o se puede obtener la data “cruda” (RAW).

Nótese los números que forman parte del codec en el ProRes 422 ó el ProRes4444. Ese 422 ó 4444 apuntan a una de las características principales de los codecs disponibles en el mercado y tienen que ver con cómo el códec maneja la información de color de la imagen o lo que es conocido como el Submuestreo de crominancia (Chroma subsampling).

El Submuestreo de crominancia es la forma en que los codecs “comprimen” la información de color para ganar espacio en el archivo al desechar información de color en algunos  pixeles de la imagen y se denota en forma de relaciones. De modo que un Submuestreo de crominancia 4:4:4 denota que no ha sido desechada ninguna información de color en ninguno de los pixeles y por lo tanto la imagen es lo más fiel posible en su reproducción cromática. Eso es lo que hace el ProRes4444, por ejemplo, el preferido para procesos de corrección de color o manipulación de imagen, ya que utiliza un Submuestreo de crominancia 4:4:4 como el nombre lo sugiere.

Entretanto una relación de 4:2:2 indica que la mitad de los píxeles de la imagen pierde información y el 4:2:0, suprime información de color en  el 75% de los pixeles. De nuevo entonces el ProRes 422 sugiere la relación de 4:2:2 que es un compromiso aceptable entre fidelidad cromática (en general imperceptible para el ojo humano) y tamaöo de archivo para la transferencia y manipulación de datos. De igual forma codecs que sub-muestran la crominancia en relación 4:2:0 son prácticamente inservibles para la manipulación posterior del color, la elaboración de efectos visuales o la realización de chroma key, ya que la pérdida de información cromática haría extremadamente difícil la manipulación del color para obtener el efecto deseado

No entraremos en detalles técnicos de lo que la nomenclatura de las relaciones 4:4:4, 4:2:2 ó 4:2:0 implican ya que es matemáticamente complejo y escapa del alcance de este artículo, pero existe abundante información al respecto en la red y en manuales técnicos para el que se interese en profundizar.

Otra de las características fundamentales de un codec y determinantes en la calidad y tamaño final del archivo, es la profundidad de Bit o profundidad de color. Básicamente la cantidad de colores que están presentes en una imagen. De modo que un codec con una profundidad de 8-bits, contiene una cantidad de 16 millones de colores, 10-bits, un millardo de colores y 12 bits 68 millones de colores. Como se puede inferir, a mayor cantidad de bits, mayorl la cantidad de colores y por lo tanto la calidad de imagen. De igual forma entonces es conveniente utilizar la mayor cantidad de bits cuando se requiere una manipulación de imagen exhaustiva para efectos especiales, corrección de color y otros procesos, pero lo que también supone un tamaño considerable de archivo.

Una de las consecuencias más evidentes al utilizar imágenes de poca profundidad de color como las de 8-bits, es cuando la imagen contiene gradientes de colores, como por ejemplo el cielo de amanecer o atardecer y se observan pequeñas bandas pixeladas entre los distintos tonos de azul (conocido como banding). Al capturar la misma imagen con 10 bits de profundidad, el codec es capaz de reproducir los sutiles cambios de color en la gradiente y por lo tanto generar una imagen limpia de y de mayor calidad. La mayoría de las cámaras profesionales y semiprofesionales de hoy en día pueden capturar imágenes de por lo menos 10-bits, pero en la creación de efectos visuales y gráficos hay que prestar atención a estos parámetros para no cometer errores.

8 bits
10 bits

Finalmente, el codec comprime la imagen con una tasa de sampleo o “Bit Rate”, lo que indica cuánta información en determinado tiempo es capturada y se denomina en Megabits por segundo (Mbps ó Mb/s). Este parámetro es el indicativo más importante de la calidad de la imagen de un archivo. Evidentemente a mayor tasa de sampleo, mayor calidad de imagen, ya que el codec intenta comprimir mayor o menor cantidad de pixeles en un segundo. Por ejemplo un archivo de video de mayor resolución (por ejemplo 4K) tendrá exactamente el mismo tamaño que un archivo de menor resolución (HD) comprimido a la misma tasa de sampleo. El primero, al tener más pixeles que comprimir a a la misma tasa que el segundo  se verá completamente pixelado al reproducirlo a la resolución original.

Por lo tanto, este es el parámetro esencial a la hora de definir el pixelado o la calidad de imagen del archivo de video que se quiere. Para reducir un archivo de tamaño, basta con reducir la tasa de sampleo, tomando en cuenta que este irá perdiendo calidad en la imagen. 

De modo que así también podemos identificar codecs de mayor o menor calidad según su mismo nombre. Por ejemplo los codecs DNxHD175, DNxHD85 ó DNxHD35 nos dan pista de su calidad relativa a la tasa de sampleo. De modo que el 175 del primero, indica una tasa de sampleo de 175 Megabits por segundo y por lo tanto tendrá una mejor calidad que el DNxHD35 que tan sólo comprime a 35 Mbps y es mejor utilizado durante la edición “offline” para conservar espacio en el disco

A través de la tasa de sampleo se puede calcular fácilmente cuánto espacio en disco duro o tarjeta de memoria necesitaremos disponible para guardar determinado tiempo de material capturado. Así, si estoy capturando con un codec a una velocidad 100 Mbps y sabemos que un Byte contiene 8 bits (bits siempre se denomina con b y Bytes con B), entonces 100 Mbps son (100/ 8) 12,5 MB (Megabytes) multiplicado por 60 segundos, son 750 MB. Osea que una hora de material me opcupa (750 x 60) 45.000 MB o lo que es lo mismo 45GB (Gigabytes).

Como hemos visto, existen varios parámetros a tomar en cuenta a lahora de escoger un codec para la captura de imágenes, la transcodificación y creación de proxies para la edición, la manipulación de imágenes para la creación de efectos visuales o correción de color y para la realización del Master final

Como ejemplo general, en los flujos de trabajo que yo manejo personalmente a diario (para largometrajes y series documentales), utilizamos el codec XAVC-I para la captura en cámara (Sony FS7), luego transcodificamos a DnxHD36 para la edición offline en Avid, H264 para la creación de screeners o copias de trabajo y finalizamos el Master a DNxHD185X o creamos “deliverables” para diversos canales de televisión que aceptan Masters en ProRes422HQ, AVC-Intra 100 (MPEG-4) ó DNxHD185X. Cuando el espacio en disco duro es suficiente y hay limitaciones de tiempo, podemos decidir transcodificar el material original XAVC-I directamente en DNxHD185X y editar directamente en una calidad «online» manteniendo este codec durante todo el proceso hasta la creación del master en el mismo codec.

Una última consideración importante es que el codec no debe ser confundido con su contenedor (container). Este es como el empaque en el cual el codec es presentado, por lo que podemos tener un codec H264 presentado en un contenedor .mp4 ó .mov. Podemos tener un contenedor .mxf que puede contener ó un codec DNxHD ó XAVC por ejemplo.