Package Exports
- @thaleslaray/n8n-nodes-elevenlabs
- @thaleslaray/n8n-nodes-elevenlabs/index.js
This package does not declare an exports field, so the exports above have been automatically detected and optimized by JSPM instead. If any package subpath is missing, it is recommended to post an issue to the original package (@thaleslaray/n8n-nodes-elevenlabs) to support the "exports" field. If that is not possible, create a JSPM override to customize the exports field for this package.
Readme
n8n-nodes-elevenlabs
Este pacote contém um nó para n8n que permite integrar a API de Speech-to-Text da ElevenLabs em seus workflows.
Funcionalidades
- Conversão de áudio para texto usando a API da ElevenLabs
- Suporte para entrada de áudio via arquivo binário ou URL
- Suporte para os modelos:
- Scribe v1
- Scribe v1 Experimental
- Opções avançadas:
- Definição de código de idioma
- Diarização (identificação de diferentes falantes)
- Timestamps com diferentes granularidades (palavra, caractere)
- Marcação de eventos de áudio (risos, passos, etc.)
- Configuração do número máximo de falantes
- Formato do arquivo de áudio
Instalação
No n8n
- Vá para Configurações > Community Nodes
- Selecione Install
- Digite
n8n-nodes-elevenlabsno campo de pesquisa - Clique em instalar
Manualmente
npm install @thaleslaray/n8n-nodes-elevenlabsConfiguração
- Obtenha sua chave de API em https://elevenlabs.io/account
- No n8n, vá para Credenciais e adicione uma nova credencial do tipo ElevenLabs API
- Insira sua chave de API no campo correspondente
Uso
Opções básicas
- Adicione o nó "ElevenLabs Speech-to-Text" ao seu workflow
- Selecione a fonte do áudio:
- Arquivo Binário: Use um arquivo de áudio de um nó anterior (ex: HTTP Request)
- URL: Use um link direto para um arquivo de áudio ou URL do Cloud Storage
- Escolha o modelo de transcrição desejado:
- Scribe v1: Modelo padrão para transcrição
- Scribe v1 Experimental: Versão experimental do modelo Scribe
Opções avançadas
- Código de Idioma: Especifique o código ISO-639-1 ou ISO-639-3 do idioma do áudio para melhorar o desempenho da transcrição
- Diarização: Ative para identificar diferentes falantes no áudio
- Timestamps: Escolha a granularidade dos timestamps:
- Nenhum: Sem timestamps
- Palavra: Timestamps por palavra (padrão)
- Caractere: Timestamps por caractere (mais preciso)
- Marcar Eventos de Áudio: Identifica e marca eventos como risos, aplausos, etc.
- Número Máximo de Falantes: Defina o número máximo de falantes esperados no áudio (1-32)
- Formato de Arquivo: Especifique o formato do arquivo de áudio:
- Outro: Para formatos comuns como MP3, WAV, etc.
- PCM 16-bit 16kHz: Para arquivos de áudio PCM específicos
Formatos de áudio suportados
A API suporta diversos formatos de áudio, incluindo:
- MP3
- WAV
- FLAC
- AAC
- OGG
- MP4
- AIFF
- WebM
Formatos de vídeo suportados
Também é possível extrair e transcrever o áudio de arquivos de vídeo nos seguintes formatos:
- MP4
- AVI
- MKV
- MOV
- WMV
- FLV
- WebM
- MPEG
- 3GPP
Exemplos de uso
Transcrever um arquivo de áudio em português
- Use um nó HTTP Request para baixar um arquivo de áudio ou use o nó Read Binary File para ler um arquivo local
- Conecte esse nó ao nó ElevenLabs Speech-to-Text
- Configure o nó para usar o modelo "Scribe v1"
- Nas opções avançadas, defina o código de idioma como "pt" para português
- Execute o workflow para obter a transcrição
Transcrever uma conferência com múltiplos participantes
- Forneça o arquivo de áudio da conferência
- Selecione o modelo "Scribe v1"
- Nas opções avançadas:
- Ative "Diarização"
- Defina "Número Máximo de Falantes" de acordo com o número de participantes
- Ative "Timestamps" com granularidade "Palavra"
- Execute o workflow para obter a transcrição com identificação de falantes
Desenvolvimento
- Clone este repositório
- Instale as dependências:
npm install - Compile o código:
npm run build - Crie um link simbólico:
npm link - No diretório de instalação do n8n:
npm link n8n-nodes-elevenlabs
Publicação
- Atualize a versão no package.json
- Faça o build:
npm run build - Publique no npm:
npm publish --access public
Licença
MIT