44,1 kHz y 16 Bit siguen siendo hoy como antes la referencia en el sector cuando se trata de técnicas de audio en el ámbito de consumo. Pero prácticamente se ha dejado de producir ya con estos estándares, porque técnicamente hoy no solo es posible mucho más, sino que además suena sencillamente mejor.
Esta diferencia se aprecia con mayor evidencia cuando examinamos la dinámica. A 16 Bit cualquier Sample puede adoptar uno de 65.536 valores de amplitud: Un Bit (dos valores: 1 o 0) elevado a 16 (216). Esto significan ya una gran cantidad de niveles dinámicos, pero no lo es tanto si consideramos cuántos Bits pueden emplearse realmente para una señal de audio.
Aquí sería por un lado el Noise Floor, el ruido de fondo, etc, diferente de cero y por tanto también se digitaliza. Los primeros dos a tres dB de la dinámica van seguramente al manto de ruido asociado, en parte fuera del rango audible, pero no obstante presente (y por tanto también se muestrea).
Tampoco el límite de sobreexcitación se presenta mejor, porque a diferencia de la técnica analógica, que a niveles muy altos reacciona con una saturación todavía agradable, en la técnica digital el límite completo está en 0 dBFS: Cuando todos los Bits están encajados, inmediatamente golpea una súbita subida de nivel en forma de ruido asociado, la distorsión armónica aumenta de un salto y chirría estrepitosamente todo. De modo que a la señal de audio digital se le debe conceder un Headroom que trabaje ampliamente la relación entre los picos de señal y el nivel medio, y esto se lleva otra vez sus buenos 3 o eventualmente incluso 4 Bits. Si volvemos a hacer cuentas, nos quedan para nuestra señal útil probablemente no más de 8 o 10 Bits, lo que variará entre 128 y 1.024 discretos niveles dinámicos, ¡y esto no es realmente ninguna maravilla!
La solución está en aumentar la profundidad de Bits, y ya se escucha algo. Tras soluciones provisionales como 18 y 20 Bits, a medio plazo se impuso el estándar de 24 Bits (cuando los 32 Bits estaban ya a la vuelta de la esquina y en diferentes secuenciadores ya eran soportados). Calculemos prontamente: 2 elevado a 24 = 224 = 16.777.216 diferentes valores. Wow, esto en comparación con los 65.536 ya es una diferencia...
Incluso si se aplican las mismas mordidas por el Noise Floor y el Headroom quedan al menos 16 Bit para la dinámica de la señal útil, y esto no está nada mal siempre y cuando podamos utilizar esos 16 Bit de forma realmente efectiva.
Bastante mejor pintan los convertidores actuales de 1-Bit. No acabábamos de reconocer que con un Bit no es suficiente para representar la dinámica de una señal de forma efectiva, y resulta que en la técnica basada en la modulación Delta parece de sobra. En principio se trata de que el convertidor decide si un valor de muestreo es mayor o menor que el anterior: Si disminuye la amplitud de la señal analógica, el convertidor toma el valor 0, si aumenta toma el valor 1. Si se combina este proceso entonces con una frecuencia de sampleo (muestreo) claramente mayor, el resultado es con el procesamiento Delta-Sigma un muestreo bastante más preciso de la señal analógica. Ciertamente los convertidores Delta-Sigma más avanzados pueden trabajar si se precisa con 384 kHz y más, ¡en términos de fidelidad y exactitud, en comparación con 44,1 kHz/16 Bit, hay un universo entre ellos! Todos los procesos de alta resolución actuales como SACD (Super Audio CD) o DSD (Direct Stream Digital) trabajan exclusivamente con conversión Delta-Sigma.
Como muestran los ejemplos también se gira entorno a la frecuencia de muestreo: Según Nyquist-Shannon la frecuencia de audio máxima está en la frecuencia de muestreo 192 kHz a 96 kHz, y con ello se rebasa en mucho el límite audible humano. En DSD la conversión de 1-Bit se impulsa a 2,8 GHz, ¿para qué todo esto si nadie va a poder oírlo? A diferencia de lo que ocurre con la dinámica, las ventajas de una alta tasa de muestreo quedan (probablemente) más bien inaudibles, pero en un rango psicológico y técnico son relevantes. Los test con personas en Japón dan como resultado que las señales con mayor tasa de muestreo se perciben más naturales que las señales en formato CD convencional. Por otro lado hay también pruebas en las que las personas que realizan el test no escuchan ninguna diferencia entre el formato CD y el formato comprimido MP3 160 kbit/stereo, ¡esto es tan raro como alarmante!
En cualquier caso podemos imaginarnos perfectamente que un convertidor que en un rango hasta 384 kHz pueda trabajar con alta precisión, comenzará ya a brillar a 44,1 kHz. Al fin y al cabo el convertidor debe reconocer con la mayor exactitud posible la tasa de muestreo que se ha fijado y realizar la conversión con precisión extrema. Una irregularidad en el tiempo, el Jitter, perjudicará la señal de forma audible, y en consecuencia se producirá el llamado ruido de fase. Incluso cuando el convertidor a 192 kHz muestra un Jitter (mínimo posible), esta anomalía en tiempo a 44,1 kHz probablemente no jugará ningún papel: Cuanto mejor pueda procesar el convertidor las altas frecuencia de muestreo, mejor podrán ser reproducidas las señales también a 44,1 kHz.
Sin embargo no parece que en un tiempo previsible nada de esto vaya a cambiar que 44,1 kHz permanezca como estándar para la reproducción de audio digital, porque así lo exige el consumidor que de forma obstinada rehusa en masa a soluciones de consumo de alta resolución.
Si el reloj de un convertidor, lo que marca el ciclo para el Samplig, trabaja sin fallos y con precisión, sería deseable que el resto de aparatos digitales involucrados se aprovecharan de esta circunstancia.
La comunicación entre dispositivos digitales siempre se basa en la dependencia de la sensibilidad del ciclo del reloj. Esto podemos compararlo con dos piñones o ruedas dentadas cuyos engranajes trabajan perfectamente juntos siempre que estén sincronizados. Tan pronto una de las ruedas varíe mínimamente su rotación en relación a la otra comenzarán los problemas, y entonces el sistema no funcionará por mucho tiempo más. Por eso tiene sentido emplear una de las ruedas como motriz para mover a la otra. Master y Slave es el lema aquí, que se traslada 1:1 a la técnica digital. Mientras que un convertidor digital esté sujeto únicamente a una periferia analógica, este será su propio Master y sincronizará la frecuencia de muestreo en su reloj de cuarzo interno. Pero tan pronto entre en escena otro aparato digital se deberá establecer una sincronización entre ambos aparatos. Tendremos entonces que decidir quién será el Master (motriz) y quién Slave (accionado). Con un convertidor de alta gama la pregunta se responde sola: Si poseéis por ejemplo un convertidor como el Crane Song HEDD, el Lynx Studio Aurora o el RME M-32 AD o bien M-32 DA en el estudio, será más que recomendable que el resto de aparatos digitales se sincronicen con estos convertidores y no al contrario. De la misma forma, un convertidor de alta calidad puede usarse como generador de reloj para todo el estudio, elevando automáticamente el valor del resto de componentes digitales que sean sincronizados como esclavos con este aparato.