Cómo procesar bien tu voz. Procesamiento de voz. Programas y grabación de voz, compresión dinámica.

Hola queridos lectores. Recientemente en mi blog publiqué un artículo titulado, en el que proporcioné un algoritmo de acciones que utilizo para ordenar mi grabación de voz. En los comentarios a este artículo me pidieron que trajera ejemplos específicos. Bueno, ahora te mostraré qué filtros y efectos hay en programa adobe Utilizo Audition para hacer que la pista de voz suene de alta calidad.

Comencemos con el hecho de que la grabación no se lleva a cabo en un estudio, sino en una oficina donde hay varias unidades de sistema y un aire acondicionado; por supuesto, todos son muy ruidosos e interfieren con la grabación. Si el aire acondicionado aún se puede apagar, entonces la unidad del sistema más ruidosa, por coincidencia, no se puede apagar; de lo contrario, cómo anotarlo :-). Me gustaría advertirle de inmediato que debido a estas condiciones no será posible eliminar todo el ruido, pero siempre que se apliquen a la pista efectos como el eco y la reverberación y la música sirva como fondo, las deficiencias desaparecerán. sé invisible.

Micrófono: Percepción 120.

La pista grabada suena así:

1 paso. Abramos la pista en Adobe Audition.

Paso 2. Realicemos la normalización. El proceso de normalización es similar a mover una perilla de volumen: toda la señal cambia en una cantidad "fija", hacia arriba o hacia abajo. Durante la normalización, el sistema encuentra el pico más alto y lo utiliza para crear el nivel general de modo que el volumen del sonido sea óptimo. Para hacer esto en el programa. Audición de Adobe seleccione la pista completa presionando las teclas Ctrl+A, y el campo con la pista de audio se coloreará el color blanco y seleccione el elemento del menú Efectos - Amplitud y Compresión - Normaliza (Proceso). Aparecerá un cuadro de diálogo en el que podrá establecer las siguientes configuraciones (normalmente elijo 90%):

La pista se verá así:


Paso 3. Deshagámonos del ruido. Para hacer esto, usando el puntero del mouse, seleccione una pequeña porción de ruido en la pista, así:


Llamar al elemento del menú Efectos - Reducción/Restauración de Ruido - Reducción de Ruido (proceso). Aparecerá el siguiente cuadro de diálogo:


Aquí deberás hacer clic en el botón. Capturar ruido Imprimir y aparecerá un gráfico de la muestra de audio de ruido seleccionada en la ventana siguiente. Si este botón no está activo, significa que ha seleccionado una porción de ruido demasiado pequeña, debe cerrar el cuadro de diálogo, seleccionar el ruido nuevamente y activar el efecto Reducción de ruido. El significado de esta acción es que el programa recordará la pista de frecuencia del ruido e intentará eliminar automáticamente todas las frecuencias similares de la pista. parámetro Reducción de ruido 94%(puedes hacerlo al 100%, dependiendo de la fuerza del ruido), deja el resto por defecto y presiona la tecla Aplicar.

Ahora preste atención a cómo se verá una parte del ruido seleccionado después de aplicar el efecto. La onda sonora se volvió casi recta.


Ahora necesitamos deshacernos del ruido en toda la pista, para hacer esto, seleccione la pista presionando Ctrl+A, llame al mismo efecto y simplemente haga clic en el botón Aplicar, se usará la muestra de ruido anterior, por lo que no es necesario realizar ajustes. hacerse. La pista se verá así:


Tenga en cuenta que las áreas resaltadas en rojo son áreas que no necesitamos y que no se vieron afectadas por la reducción de ruido, ya que se trata de un registro de la respiración. Eliminémoslos manualmente. Para hacer esto, seleccione cada una de estas piezas, haga clic derecho y seleccione Silencio.


Etapa 4 Compresión. El proceso de cambiar la dinámica del sonido, nivelar su volumen y hacer que un sonido fuerte sea más silencioso. Básicamente, un compresor es un control de volumen automático. La compresión es una de las las etapas más importantes procesamiento de sonido, le permite "resaltar", "compactar", "oscilar", "nivelar" y acentuar el sonido. Seleccionemos un elemento Efectos - Amplitud y Compresión - Procesamiento dinámico. Aparecerá un cuadro de diálogo en el que podrá seleccionar varias opciones configuración predeterminada o establezca sus propias configuraciones.

elegí la configuración Límite suave -24 dB y experimenté con la curva: el punto que moví está resaltado en rojo. En general, siempre debe escuchar a qué cambios conducen sus acciones y elegir lo que se adapta a su audición; aquí no existen configuraciones universales. Y siempre podrás escuchar el resultado sin salir del cuadro de diálogo presionando el botón Jugar en la esquina inferior izquierda.

Si, después de la compresión, “sale” más ruido, como se muestra a continuación, entonces puede deshacerse de ellos repitiendo el algoritmo de reducción de ruido, siguiendo el ejemplo del paso 3.


Paso 5 Igualada. Bueno, aquí no lo llamaría obligatorio. Pero aún. Intentemos experimentar con frecuencias específicas. Elegir Efectos – Filtro y EQ – Ecualizador gráfico (30 Bandas). Aparecerá un cuadro de diálogo en el que podrás ajustar frecuencias específicas, siguiendo las recomendaciones de la lección anterior o de forma puramente intuitiva, escuchando cada vez el resultado de los cambios, como hice yo:


Ahora, en principio, puedes escuchar el resultado:

Decidí no quedarme ahí, así que:

Paso 6 Reverberación. Este es el efecto que se crea cuando se escucha cualquier sonido en un espacio cerrado, lo que produce reflejos en las superficies de las paredes causando un gran número de eco, luego el sonido se desvanece lentamente debido a la absorción ondas sonoras paredes y aire. Seleccionemos un elemento Efectos - Reverberación - Reverberación envolvente. Configuremos los valores para que se logre el sonido deseado, no olvides escuchar nuestros cambios. Y para mí son así:


El resultado fue el siguiente:

Espero que hayas encontrado útil mi artículo. Y no juzguéis estrictamente, ya que todo lo que acabo de mostrar lo desenterré yo mismo en Internet sin la ayuda de profesionales. Si crees que tienes mucho más conocimiento sobre procesamiento de alta calidad voces, luego escribe sobre tu experiencia en los comentarios de esta publicación. Será muy interesante. ¡Mis mejores deseos!

(Visitado 15.846 veces, 3 visitas hoy)

Terminado, comienza la etapa de edición. Voz humana es extremadamente expresivo en sí mismo, pero con la ayuda de varios métodos de procesamiento de sonido puedes obtener efectos de voz aún más interesantes y vibrantes. Todo el espectro se puede utilizar para voz. métodos existentes procesamiento: amplitud, frecuencia, fase, tiempo, etc.

La corrección de frecuencia o, como dicen los ingenieros de sonido, la ecualización es uno de los efectos más populares para el procesamiento de voz. Desafortunadamente, también es uno de los efectos de los que a menudo se abusa. Si se ecualiza incorrectamente, el resultado final puede sonar incluso peor que antes de usarlo.

Por supuesto, no existen reglas estrictas según las cuales se debe procesar el espectro de frecuencias de la voz, pero sí hay principios básicos que se discutirán.

Al procesar una voz grabada, por regla general, primero se aplica un filtro de paso alto de 60-100 Hz. En algunos casos, la altura de corte de las bajas frecuencias alcanza los 150 Hz, dependiendo de la naturaleza de la voz del locutor y su timbre. Esto permitirá, en primer lugar, deshacerse de los sonidos innecesarios de baja frecuencia y, en segundo lugar, si es necesario, reducir la cantidad excesiva de bajas frecuencias que surgen debido al efecto de proximidad de un micrófono direccional. A veces el efecto de proximidad “juega a tu favor” porque Hace que el timbre de la voz sea más cálido e íntimo. El bajo también se eleva para dar voz masculina aterciopelado. Las voces "murmurantes" a menudo requieren corrección de los medios bajos y un filtro de paso bajo de 100-250 Hz. El rango de frecuencia de 800 a 1500 Hz le da potencia y confianza a la voz, pero lo principal aquí es no exagerar al aumentar el nivel en este rango, porque Si hay un exceso de estas frecuencias puede aparecer un sonido nasal. Un ligero aumento en el rango de 2500-5000 Hz puede proporcionar una mejor inteligibilidad del habla. Un ligero aumento en el nivel de las altas frecuencias (12-18 kHz) resaltará los armónicos altos y le dará al sonido brillo, "vuelo", "ligereza".

Un problema común que encuentra un ingeniero de sonido al grabar el habla son las sibilancias: consonantes que silban. Por supuesto, siempre puedes recurrir a dispositivos especiales: de-essers, pero La mejor manera- Se trata de encontrar consonantes silbantes y "limpiar" manualmente frecuencias en la región de 6 a 8 kHz, según el timbre de la voz y el sexo del hablante.

Filtro de paso bajo.


Corrección de frecuencia típica del habla. Se ha limpiado el sonido “nasal” en los medios graves y se han aumentado los agudos para obtener un sonido más inteligible y brillante.

Al procesar la voz en la publicidad, en la gran mayoría de los casos se utiliza el procesamiento dinámico de la voz: compresión. La compresión del sonido puede hacer que la voz sea más rica y “densa”. La configuración de los parámetros del compresor es individual para cada voz, pero hay valores iniciales que son universales.

Para timbres "pegajosos", con articulación débil, se establece un ataque mayor y un tiempo de liberación más corto. Los ajustes de compresión típicos para enfatizar el ataque de consonantes y, en consecuencia, mejorar la inteligibilidad son los siguientes:

Ataque 20-50 ms, Liberación 5-20 ms, Relación = 3-5.

Si el timbre del hablante es menos "viscoso", se necesita una voz con buen tono y articulación para regular la densidad general. Se muestra un ataque más pequeño. El tiempo de recuperación es inversamente proporcional a la velocidad del habla, es decir un ritmo alto corresponde a un tiempo de recuperación más corto y viceversa:

Ataque 0-10 ms, Liberación 5-50 ms, Relación = 5-20.

Original "hierro" V.I.P. Las herramientas de procesamiento de voz son bastante caras, pero con la llegada de sus clones de software, muchos estudios, incluso los más grandes, pueden permitirse el lujo de utilizarlas. sonido único. Uno de los dispositivos más populares es el UREI 1176, que tiene un sonido de radio reconocible.



Emulación de UREI 1176 de UNIVERSALAUDIO.

Hacia el procesamiento espacial voz del locutor no recurren a él con tanta frecuencia o lo utilizan al mínimo. El efecto de reverberación o retardo se utiliza a menudo para énfasis semántico, si es necesario resaltar un bloque o frase separada (dirección, número de teléfono, etc.), así como si el guión del vídeo lo requiere (para crear el efecto de presencia en un estadio o sala de conciertos).

El procesamiento final se llama masterización. Sin embargo, según el autor, en publicidad tal procesamiento se puede llamar masterización con gran extensión. De hecho, para la corrección final, solo se utiliza principalmente una herramienta: un ultramaximizador; como regla general, un ultramaximizador es un dispositivo que incluye un limitador y un amplificador.


Ultramaximizador de rack WavesL2.

No es ningún secreto que los anuncios de radio modernos están sujetos a una compresión "dura". La razón de esto fue que en los años 70 se notó que aquellas obras que sonaban más fuerte que otras en la radio agradaban más a los oyentes, ya que parecían más brillantes, más dinámicas y, en consecuencia, los medios de audio con estas obras se vendían mejor. También en la publicidad todo el mundo intenta destacarse del resto y la forma más fácil es simplemente hacer más ruido que los demás (lea el artículo “La guerra por el volumen”). El autor de este artículo no es partidario de dicho procesamiento, pero debido a las tradiciones establecidas, siempre hay que recurrir a él en la publicidad radiofónica.

Versión de software del dispositivo WavesL3.

Una vez más quiero señalar que todas las herramientas y sus configuraciones enumeradas aquí no son una guía para la acción. Aquí sólo se dan los parámetros principales. Cada voz del locutor es individual y requiere un enfoque individual.

Volver a noticias...

En la grabación de sonido, como en cualquier otro campo de actividad profesional, existen muchos matices y reglas. ¡Ésta es una “ciencia” absolutamente exacta que hay que aprender! Y aprenda, no solo presione el botón "grabar", sino aprenda cómo grabar una voz correctamente, en qué condiciones y por qué, aprenda el procesamiento de la voz en teoría, familiarícese y estudie. programas para grabar y procesar voz. El lado práctico de esta cuestión radica en el uso directo de equipos y programas de estudio, así como en su configuración. Por supuesto, en la vida cotidiana todo el mundo quiere evitar todas las dificultades y simplificar al máximo su tarea, al menos si sólo necesita grabar y procesar su voz en casa. Además, para que trabajar con archivos de sonido sea lo más sencillo posible, podemos proporcionarte herramientas sencillas pero muy útiles. programas en línea. Por ejemplo, puedes recortar fácilmente cualquier archivo de audio usando nuestro archivo .

Procesamiento básico de voz durante y después de la grabación. Compresión dinámica.

Y analizamos superficialmente la selección de un micrófono en nuestro artículo reciente, por lo que si volvemos a este tema, seguramente será en otro momento. Ahora, abordemos este tema más en serio. Entonces, idealmente, procesamiento de voz se divide en 2 etapas: procesamiento de voz durante el proceso de grabación y procesamiento de un archivo de sonido ya grabado. En la primera etapa utilizamos preamplificadores de micrófono y compresores de “hardware”, mientras que la segunda etapa está dedicada al procesamiento de archivos de sonido con software de estudio especializado.

Procesamiento primario de voz durante el proceso de grabación.

Como ya hemos señalado, para cualitativamente grabar la voz del locutor, en el camino entre el micrófono y la computadora, aparecen un preamplificador de micrófono y un compresor externo. Para conseguir un sonido suave y cálido, los expertos recomiendan utilizar dispositivos de válvulas que den un color “analógico” característico al sonido reproducido. Pero en cuanto al tema de los compresores, se puede tratar con más detalle. Por cierto, un buen hardware de estudio cuesta mucho dinero, por lo que si mencionas la grabación de voz en casa, simplemente no se hablará de ese lujo. Compresor en procesamiento de voz se aplicará dos veces. Por eso nos centraremos en ello.

Software de procesamiento de voz y complementos especializados.

Compresión de audio dinámica(Compresión dinámica) es el proceso de comprimir el rango de señal de un archivo de audio. En otras palabras, se trata de la alineación de fragmentos altos y bajos de nuestra grabación de audio de acuerdo con parámetros especificados. ¡Ni un solo archivo grabado está completo sin este proceso! Aquellos. software procesamiento de voz no termina ahí, pero el compresor es lo básico y ¡profundizaremos en ello!


La configuración de los compresores de “hardware” (externos) al procesar voces y complementos de software no es diferente. En términos generales, "exprimimos" programáticamente lo que no "exprimimos" durante la grabación. ¿Por qué no arruinar todo de una vez para no volver a hacerlo en los programas de procesamiento de audio o viceversa? La respuesta es simple. En curso grabaciones de voz del locutor, utilizamos un compresor y un limitador para suavizar inicialmente los picos y eliminar la distorsión del sonido durante un posible "clipping" (momentos de grabación excesivamente fuertes que entran en la "zona roja" de los sensores). Software procesamiento de voz, es necesario para lograr el objetivo final, por lo que la voz original debe estar grabada en alta calidad y al mismo tiempo ser un “producto semiacabado”.

Configuración del compresor. Parámetros de compresión dinámica estándar.

Vale la pena enfatizar de inmediato que No existe una configuración de compresor universal. Ya que depende absolutamente directamente del archivo fuente y de las tareas asignadas. Pero, sin embargo, hay parámetros estándar que se utilizan, incluso en los "preajustes", como básicos para un mayor ajuste. Por ejemplo, requieren atención a la hora de reconfigurar equipos debido a las peculiaridades de la diferencia en las frecuencias reproducidas.

Configuraciones básicas del compresor


Límite. Este es el umbral de respuesta del compresor. Se expresa en decibelios y determina el nivel máximo de señal a partir del cual el compresor comienza a funcionar y lo reduce.

Relación. Nivel de compresión de la señal. Aquellos. la relación entre la compresión de la señal y el umbral máximo permitido.

Ataque. Este es el tiempo de funcionamiento del compresor. Se expresa en milisegundos y establece el tiempo desde el momento en que se excede la señal del umbral hasta el momento en que se alcanza la relación especificada.

Liberar. Este parámetro indica el tiempo en milisegundos en que la señal cayó al umbral aceptable y el momento en que el compresor dejó de reducirla.

Configuración del compresor para voz.

Repitamos que no existen configuraciones universales, solo básicas. configuración del compresor de voz, a partir del cual puedes construir. Al configurar sus equipos, se guían por las características. propia voz y sus entornos pueden ser “fundamentalmente” diferentes entre sí. Y la mayoría de los complementos de compresores establecen un promedio configuración de procesamiento de voz. Podemos ofrecer los siguientes parámetros.

Si su archivo tiene un “espaciado” bastante grande de picos de gráficos, entonces se requiere una compresión bastante grande. Podemos utilizar las siguientes configuraciones del compresor de procesamiento de voz:

Tiempo de ataque = 0,3 ms
Tiempo de liberación = 40 ms
Umbral = -3 dB
Relación = 4:1

Si tiene un gráfico con saltos menores, comenzaremos la compresión de voz de esta manera:

Tiempo de ataque = 0,3 ms
Tiempo de liberación = 50 ms
Umbral = -8 dB
Relación = 2:1

Bueno, descubrimos un poco sobre el procesamiento básico de voz. Luego puedes pasar al siguiente paso: procesar la voz con efectos. Pero los efectos para la voz son un tema muy amplio y probablemente le dedicaremos un artículo completo. No quiero hablar de cosas tan serias de pasada, porque... En realidad, es un proceso muy interesante y hay muchos efectos fantásticos que se pueden utilizar para diversos propósitos.