Esta página foi traduzida do inglês pela comunidade. Saiba mais e junte-se à comunidade MDN Web Docs.
API Web Áudio
Baseline
Widely available
*
This feature is well established and works across many devices and browser versions. It’s been available across browsers since abril de 2021.
* Some parts of this feature may have varying levels of support.
A API de áudio da Web fornece um sistema poderoso e versátil para controlar o áudio na Web, permitindo que os desenvolvedores escolham fontes de áudio, adicionem efeitos ao áudio, criem visualizações de áudio, apliquem efeitos espaciais (como panorâmica) e muito mais.
Conceitos e uso de áudio da Web
A API de áudio da Web envolve a manipulação de operações de áudio dentro de um contexto de áudio e foi projetada para permitir o roteamento modular. As operações básicas de áudio são realizadas com nós de áudio, que são vinculados para formar um gráfico de roteamento de áudio. Várias fontes — com diferentes tipos de layout de canal — são suportadas mesmo dentro de um único contexto. Este design modular oferece flexibilidade para criar funções de áudio complexas com efeitos dinâmicos.
Os nós de áudio são ligados em cadeias e teias simples por suas entradas e saídas. Eles geralmente começam com uma ou mais fontes. As fontes fornecem matrizes de intensidades sonoras (amostras) em fatias de tempo muito pequenas, geralmente dezenas de milhares delas por segundo. Estes podem ser calculados matematicamente (como OscillatorNode), ou podem ser gravações de arquivos de som/vídeo (como AudioBufferSourceNode e MediaElementAudioSourceNode ) e fluxos de áudio (MediaStreamAudioSourceNode). Na verdade, os arquivos de som são apenas gravações das próprias intensidades sonoras, que vêm de microfones ou instrumentos elétricos e são misturadas em uma única e complicada onda.
As saídas desses nós podem ser vinculadas às entradas de outros, que misturam ou modificam esses fluxos de amostras de som em diferentes fluxos. Uma modificação comum é multiplicar as amostras por um valor para torná-las mais altas ou mais baixas (como é o caso de GainNode). Uma vez que o som tenha sido suficientemente processado para o efeito pretendido, ele pode ser vinculado à entrada de um destino (BaseAudioContext.destination), que envia o som para os alto-falantes ou fones de ouvido. Esta última conexão só é necessária se o usuário tiver que ouvir o áudio.
Um fluxo de trabalho simples e típico para áudio da web seria algo assim:
- Criar contexto de áudio
- Dentro do contexto, crie fontes — como
<áudio>, oscilador, fluxo - Crie nós de efeitos, como reverb, filtro biquad, panner, compressor
- Escolha o destino final do áudio, por exemplo, os alto-falantes do sistema
- Conecte as fontes aos efeitos e os efeitos ao destino.
O tempo é controlado com alta precisão e baixa latência, permitindo que os desenvolvedores escrevam código que responda com precisão a eventos e seja capaz de direcionar amostras específicas, mesmo em uma alta taxa de amostragem. Assim, aplicações como baterias eletrônicas e sequenciadores estão bem ao alcance.
A API de áudio da Web também nos permite controlar como o áudio é espacializado. Utilizando um sistema baseado em um modelo de ouvinte-fonte, permite o controle do modelo panorâmico e trata da atenuação induzida por distância induzida por uma fonte em movimento (ou ouvinte em movimento).
você pode ler sobre a teoria da API de áudio da Web com muito mais detalhes em nosso artigo Conceitos básicos por trás da API de áudio da Web .
Público-alvo da API de áudio da Web
A API de áudio da Web pode parecer intimidante para aqueles que não estão familiarizados com termos de áudio ou música e, como incorpora uma grande quantidade de funcionalidades, pode ser difícil começar se você for um desenvolvedor.
Ele pode ser usado para incorporar áudio em seu site ou aplicativo, fornecendo uma atmosfera como futurelibrary.no ou feedback auditivo em formulários. No entanto, também pode ser usado para criar instrumentos interativos avançados. Com isso em mente, é adequado tanto para desenvolvedores quanto para músicos.
Temos um tutorial introdutório simples para aqueles que estão familiarizados com programação, mas precisam de uma boa introdução a alguns dos termos e estrutura da API.
Há também um artigo Conceitos básicos por trás da API de áudio da Web, para ajudá-lo a entender como o áudio digital funciona, especificamente no domínio da API. Isso também inclui uma boa introdução a alguns dos conceitos sobre os quais a API é construída.
Aprender a codificar é como jogar cartas - você aprende as regras, depois joga, depois volta e aprende as regras novamente, depois joga novamente. Portanto, se parte da teoria não se encaixar bem após o primeiro tutorial e artigo, há um tutorial avançado que estende o primeiro para ajudá-lo a praticar o que você aprendeu e aplicar algumas técnicas mais avançadas para construir um sequenciador de passos.
Também temos outros tutoriais e material de referência abrangente disponível que abrange todos os recursos da API. Veja a barra lateral nesta página para saber mais.
Se você está mais familiarizado com o lado musical das coisas, está familiarizado com os conceitos de teoria musical, quer começar a construir instrumentos, então você pode ir em frente e começar a construir coisas com o tutorial avançado e outros como um guia (o tutorial linkado acima cobre agendando notas, criando osciladores e envelopes sob medida, bem como um LFO entre outras coisas.)
Se você não estiver familiarizado com o básico de programação, você pode querer consultar alguns tutoriais JavaScript para iniciantes e depois voltar aqui - veja nosso módulo de aprendizado JavaScript para iniciantes para um ótimo lugar para começar.
Interfaces da API de áudio da Web
A API de áudio da Web tem várias interfaces e eventos associados, que dividimos em nove categorias de funcionalidade.
Definição geral do gráfico de áudio
Contêineres e definições gerais que moldam gráficos de áudio no uso da API de áudio da Web.
AudioContext-
A interface
AudioContextrepresenta um gráfico de processamento de áudio construído a partir de módulos de áudio ligados entre si, cada um representado por umAudioNode. Um contexto de áudio controla a criação dos nós que ele contém e a execução do processamento ou decodificação de áudio. Você precisa criar umAudioContextantes de fazer qualquer outra coisa, pois tudo acontece dentro de um contexto. AudioNode-
A interface
AudioNoderepresenta um módulo de processamento de áudio como uma fonte de áudio (por exemplo, um elemento HTML<audio>ou<video>), audio destino, módulo de processamento intermediário (por exemplo, um filtro comoBiquadFilterNodeou controle de volume comoGainNode). AudioParam-
A interface
AudioParamrepresenta um parâmetro relacionado ao áudio, como um de umAudioNode. Ele pode ser definido para um valor específico ou uma alteração no valor e pode ser programado para ocorrer em um horário específico e seguindo um padrão específico. AudioParamMap-
Fornece uma interface tipo mapa para um grupo de interfaces
AudioParam, o que significa que fornece os métodosforEach(),get(),has(),keys ()evalues(), bem como uma propriedadesize. BaseAudioContext-
A interface
BaseAudioContextatua como uma definição básica para gráficos de processamento de áudio online e offline, conforme representado porAudioContexteOfflineAudioContextrespectivamente . Você não usariaBaseAudioContextdiretamente — você usaria seus recursos por meio de uma dessas duas interfaces herdadas. - O evento
ended -
O evento
endedé acionado quando a reprodução é interrompida porque o fim da mídia foi atingido.
Definindo fontes de áudio
Interfaces que definem fontes de áudio para uso na API de áudio da Web.
AudioScheduledSourceNode-
O
AudioScheduledSourceNodeé uma interface pai para vários tipos de interfaces de nó de fonte de áudio. É umAudioNode. OscillatorNode-
A interface
OscillatorNoderepresenta uma forma de onda periódica, como uma onda senoidal ou triangular. É um módulo de processamento de áudioAudioNodeque faz com que uma determinada frequência de onda seja criada. AudioBuffer-
A interface
AudioBufferrepresenta um pequeno recurso de áudio que reside na memória, criado a partir de um arquivo de áudio usando o métodoBaseAudioContext.decodeAudioDataou criado com dados brutos usandoBaseAudioContext.createBuffer. Uma vez decodificado neste formato, o áudio pode ser colocado em umAudioBufferSourceNode. AudioBufferSourceNode-
A interface
AudioBufferSourceNoderepresenta uma fonte de áudio que consiste em dados de áudio na memória, armazenados em umAudioBuffer. É umAudioNodeque atua como uma fonte de áudio. MediaElementAudioSourceNode-
A interface
MediaElementAudioSourceNoderepresenta uma fonte de áudio que consiste em um elemento HTML<audio>ou<video>. É umAudioNodeque atua como uma fonte de áudio. MediaStreamAudioSourceNode-
A interface
MediaStreamAudioSourceNoderepresenta uma fonte de áudio que consiste em umMediaStream(como uma webcam, microfone ou um fluxo sendo enviado de um computador remoto). Se várias faixas de áudio estiverem presentes no fluxo, a faixa cujoidvem primeiro lexicograficamente (em ordem alfabética) é usada. É umAudioNodeque atua como uma fonte de áudio. MediaStreamTrackAudioSourceNode-
Um aceno de cabeça e do tipo
MediaStreamTrackAudioSourceNoderepresenta uma fonte de áudio cujos dados vêm de umMediaStreamTrack. Ao criar o nó usando o métodocreateMediaStreamTrackSource()para criar o nó, você especifica qual faixa usar. Isso fornece mais controle do queMediaStreamAudioSourceNode.
Definindo filtros de efeitos de áudio
Interfaces para definir os efeitos que você deseja aplicar às suas fontes de áudio.
BiquadFilterNode-
A interface
BiquadFilterNoderepresenta um filtro simples de baixa ordem. É umAudioNodeque pode representar diferentes tipos de filtros, dispositivos de controle de tom ou equalizadores gráficos. UmBiquadFilterNodesempre tem exatamente uma entrada e uma saída. ConvolverNode-
A interface
ConvolverNodeé umAudioNodeque executa uma Convolução Linear em um determinadoAudioBuffere é frequentemente usado para obter um reverb efeito. DelayNode-
A interface
DelayNoderepresenta uma linha de atraso; um módulo de processamento de áudioAudioNodeque causa um atraso entre a chegada de um dado de entrada e sua propagação para a saída. DynamicsCompressorNode-
A interface
DynamicsCompressorNodefornece um efeito de compressão, que reduz o volume das partes mais altas do sinal para ajudar a evitar cortes e distorções que podem ocorrer quando vários sons são reproduzidos e multiplexados ao mesmo tempo. GainNode-
A interface
GainNoderepresenta uma mudança no volume. É um módulo de processamento de áudioAudioNodeque faz com que um determinado gain seja aplicado aos dados de entrada antes de sua propagação para a saída. WaveShaperNode-
A interface
WaveShaperNoderepresenta um distorção não linear. É umAudioNodeque usa uma curva para aplicar uma distorção de forma de onda ao sinal. Além dos efeitos de distorção óbvios, é frequentemente usado para adicionar uma sensação de calor ao sinal. PeriodicWave-
Descreve uma forma de onda periódica que pode ser usada para moldar a saída de um
OscillatorNode. IIRFilterNode-
Implementa um filtro geral de resposta ao impulso infinito (IIR); este tipo de filtro pode ser usado para implementar dispositivos de controle de tom e equalizadores gráficos também.
Definindo destinos de áudio
Assim que você terminar de processar seu áudio, essas interfaces definem onde ele deve ser emitido.
AudioDestinationNode-
A interface
AudioDestinationNoderepresenta o destino final de uma fonte de áudio em um determinado contexto — geralmente os alto-falantes do seu dispositivo. MediaStreamAudioDestinationNode-
A interface
MediaStreamAudioDestinationNoderepresenta um destino de áudio que consiste em um WebRTCMediaStreamcom um únicoAudioMediaStreamTrack, que pode ser usado de maneira semelhante a umMediaStreamobtido degetUserMedia(). É umAudioNodeque atua como destino de áudio.
Análise e visualização de dados
Se você deseja extrair tempo, frequência e outros dados do seu áudio, o AnalyserNode é o que você precisa.
AnalyserNode-
A interface
AnalyserNoderepresenta um nó capaz de fornecer informações de análise de frequência e domínio de tempo em tempo real, para fins de análise e visualização de dados.
Dividindo e mesclando canais de áudio
Para dividir e mesclar canais de áudio, você usará essas interfaces.
ChannelSplitterNode-
A interface
ChannelSplitterNodesepara os diferentes canais de uma fonte de áudio em um conjunto de saídas mono. ChannelMergerNode-
A interface
ChannelMergerNodereúne diferentes entradas mono em uma única saída. Cada entrada será usada para preencher um canal da saída.
Espacialização de áudio
Essas interfaces permitem adicionar efeitos panorâmicos de espacialização de áudio às suas fontes de áudio.
AudioListener-
A interface
AudioListenerrepresenta a posição e orientação da única pessoa que está ouvindo a cena de áudio usada na espacialização de áudio. PannerNode-
A interface
PannerNoderepresenta a posição e o comportamento de um sinal de fonte de áudio no espaço 3D, permitindo criar efeitos de panorâmica complexos. StereoPannerNode-
A interface
StereoPannerNoderepresenta um simples nó panorâmico estéreo que pode ser usado para deslocar um fluxo de áudio para a esquerda ou para a direita.
Processamento de áudio em JavaScript
Usando worklets de áudio, você pode definir nós de áudio personalizados escritos em JavaScript ou WebAssembly. Worklets de áudio implementam a interface Worklet, uma versão leve da interface Worker.
AudioWorklet-
A interface
AudioWorkletestá disponível através do objetoAudioContextdo objetoaudioWorklete permite adicionar módulos ao worklet de áudio a ser executado fora do thread principal. AudioWorkletNode-
A interface
AudioWorkletNoderepresenta umAudioNodeque está embutido em um gráfico de áudio e pode passar mensagens para oAudioWorkletProcessorcorrespondente. AudioWorkletProcessor-
A interface
AudioWorkletProcessorrepresenta o código de processamento de áudio executado em umAudioWorkletGlobalScopeque gera, processa ou analisa o áudio diretamente e pode passar mensagens para oAudioWorkletNodecorrespondente. AudioWorkletGlobalScope-
A interface
AudioWorkletGlobalScopeé um objeto derivado deWorkletGlobalScopeque representa um contexto de trabalho no qual um script de processamento de áudio é executado; ele foi projetado para permitir a geração, processamento e análise de dados de áudio diretamente usando JavaScript em um encadeamento de worklet em vez de no encadeamento principal.
Obsoleto: nós do processador de script
Antes da definição dos worklets de áudio, a API de áudio da Web usava o ScriptProcessorNode para processamento de áudio baseado em JavaScript. Como o código é executado no thread principal, eles têm um desempenho ruim. O ScriptProcessorNode é mantido por motivos históricos, mas está marcado como obsoleto.
ScriptProcessorNodeDeprecated-
A interface
ScriptProcessorNodepermite a geração, processamento ou análise de áudio usando JavaScript. É um módulo de processamento de áudioAudioNodeque está vinculado a dois buffers, um contendo a entrada atual e outro contendo a saída. Um evento, implementando a interfaceAudioProcessingEvent, é enviado ao objeto toda vez que o buffer de entrada contém novos dados, e o manipulador de eventos termina quando preenche o buffer de saída com dados. audioprocess(evento) Deprecated-
O evento
audioprocessé acionado quando um buffer de entrada de uma API de áudio da WebScriptProcessorNodeestá pronto para ser processado. AudioProcessingEventDeprecated-
O
AudioProcessingEventrepresenta eventos que ocorrem quando um buffer de entradaScriptProcessorNodeestá pronto para ser processado.
Processamento de áudio off-line/de fundo
É possível processar/renderizar um gráfico de áudio muito rapidamente em segundo plano — renderizando-o para um AudioBuffer em vez de para os alto-falantes do dispositivo — com o seguinte.
OfflineAudioContext-
A interface
OfflineAudioContexté uma interfaceAudioContextque representa um gráfico de processamento de áudio construído a partir deAudioNodes vinculados. Em contraste com umAudioContextpadrão, umOfflineAudioContextrealmente não renderiza o áudio, mas o gera, tão rápido quanto possível, em um buffer. complete(evento)-
O evento
completeé acionado quando a renderização de umOfflineAudioContexté encerrada. OfflineAudioCompletionEvent-
O
OfflineAudioCompletionEventrepresenta eventos que ocorrem quando o processamento de umOfflineAudioContexté encerrado. O eventocompleteusa essa interface.
Guias e tutoriais
- Tutorial e exemplo: Teclado de Sintetizador Simples
Este artigo apresenta o código e uma demonstração funcional de um teclado que você pode tocar usando seu mouse. O teclado lhe permite alternar entre formas de onda padrões e customizadas. Esse exemplo utiliza das seguintes interfaces de Web API:
AudioContext,OscillatorNode,PeriodicWave, eGainNode.
Exemplos
Você pode encontrar vários exemplos em nosso repositório webaudio-example no GitHub.
Especificações
| Specification |
|---|
| Web Audio API> # AudioContext> |
Compatibilidade com navegadores
>AudioContext
Loading...
Veja também
>Tutoriais/guias
- Conceitos básicos por trás da API de áudio da Web
- Usando a API de áudio da Web
- Técnicas avançadas: criação de som, sequenciamento, temporização, agendamento
- Guia de reprodução automática para APIs de mídia e áudio da Web
- Usando filtros IIR
- Visualizações com API de áudio da Web
- Noções básicas de espacialização de áudio da Web
- Controlando vários parâmetros com ConstantSourceNode
- Misturando áudio posicional e WebGL (2012)
- Desenvolvendo o áudio do jogo com a API de áudio da Web (2012)
- Migrando código webkitAudioContext para padrões baseados em AudioContext
Bibliotecas
- Tones: uma biblioteca simples para tocar tons/notas específicos usando a API de áudio da Web.
- Tone.js: um framework para criar música interativa no navegador.
- howler.js: uma biblioteca de áudio JS que tem como padrão Web Audio API e retorna para HTML Audio, além de fornecer outros recursos úteis.
- Mooog: encadeamento de AudioNodes no estilo jQuery, envios/retornos no estilo do mixer e muito mais.
- XSound: Biblioteca Web Audio API para Sintetizador, Efeitos, Visualização, Gravação, etc.
- OpenLang: aplicativo da Web do laboratório de linguagem de vídeo HTML usando a API de áudio da Web para gravar e combinar vídeo e áudio de diferentes fontes em um único arquivo (fonte no GitHub)
- Pts.js: Simplifica a visualização de áudio na web (guide)