Package Exports

@thaleslaray/n8n-nodes-elevenlabs
@thaleslaray/n8n-nodes-elevenlabs/index.js

This package does not declare an exports field, so the exports above have been automatically detected and optimized by JSPM instead. If any package subpath is missing, it is recommended to post an issue to the original package (@thaleslaray/n8n-nodes-elevenlabs) to support the "exports" field. If that is not possible, create a JSPM override to customize the exports field for this package.

Readme

n8n-nodes-elevenlabs

Este pacote contém um nó para n8n que permite integrar a API de Speech-to-Text da ElevenLabs em seus workflows.

Funcionalidades

Conversão de áudio para texto usando a API da ElevenLabs
Suporte para entrada de áudio via arquivo binário ou URL
Suporte para os modelos:
- Scribe v1
- Scribe v1 Experimental
Opções avançadas:
- Definição de código de idioma
- Diarização (identificação de diferentes falantes)
- Timestamps com diferentes granularidades (palavra, caractere)
- Marcação de eventos de áudio (risos, passos, etc.)
- Configuração do número máximo de falantes
- Formato do arquivo de áudio

Instalação

No n8n

Vá para Configurações > Community Nodes
Selecione Install
Digite n8n-nodes-elevenlabs no campo de pesquisa
Clique em instalar

Manualmente

npm install @thaleslaray/n8n-nodes-elevenlabs

Configuração

Obtenha sua chave de API em https://elevenlabs.io/account
No n8n, vá para Credenciais e adicione uma nova credencial do tipo ElevenLabs API
Insira sua chave de API no campo correspondente

Uso

Opções básicas

Adicione o nó "ElevenLabs Speech-to-Text" ao seu workflow
Selecione a fonte do áudio:
- Arquivo Binário: Use um arquivo de áudio de um nó anterior (ex: HTTP Request)
- URL: Use um link direto para um arquivo de áudio ou URL do Cloud Storage
Escolha o modelo de transcrição desejado:
- Scribe v1: Modelo padrão para transcrição
- Scribe v1 Experimental: Versão experimental do modelo Scribe

Opções avançadas

Código de Idioma: Especifique o código ISO-639-1 ou ISO-639-3 do idioma do áudio para melhorar o desempenho da transcrição
Diarização: Ative para identificar diferentes falantes no áudio
Timestamps: Escolha a granularidade dos timestamps:
- Nenhum: Sem timestamps
- Palavra: Timestamps por palavra (padrão)
- Caractere: Timestamps por caractere (mais preciso)
Marcar Eventos de Áudio: Identifica e marca eventos como risos, aplausos, etc.
Número Máximo de Falantes: Defina o número máximo de falantes esperados no áudio (1-32)
Formato de Arquivo: Especifique o formato do arquivo de áudio:
- Outro: Para formatos comuns como MP3, WAV, etc.
- PCM 16-bit 16kHz: Para arquivos de áudio PCM específicos

Formatos de áudio suportados

A API suporta diversos formatos de áudio, incluindo:

MP3
WAV
FLAC
AAC
OGG
MP4
AIFF
WebM

Formatos de vídeo suportados

Também é possível extrair e transcrever o áudio de arquivos de vídeo nos seguintes formatos:

MP4
AVI
MKV
MOV
WMV
FLV
WebM
MPEG
3GPP

Exemplos de uso

Transcrever um arquivo de áudio em português

Use um nó HTTP Request para baixar um arquivo de áudio ou use o nó Read Binary File para ler um arquivo local
Conecte esse nó ao nó ElevenLabs Speech-to-Text
Configure o nó para usar o modelo "Scribe v1"
Nas opções avançadas, defina o código de idioma como "pt" para português
Execute o workflow para obter a transcrição

Transcrever uma conferência com múltiplos participantes

Forneça o arquivo de áudio da conferência
Selecione o modelo "Scribe v1"
Nas opções avançadas:
- Ative "Diarização"
- Defina "Número Máximo de Falantes" de acordo com o número de participantes
- Ative "Timestamps" com granularidade "Palavra"
Execute o workflow para obter a transcrição com identificação de falantes

Desenvolvimento

Clone este repositório
Instale as dependências: npm install
Compile o código: npm run build
Crie um link simbólico: npm link
No diretório de instalação do n8n: npm link n8n-nodes-elevenlabs

Publicação

Atualize a versão no package.json
Faça o build: npm run build
Publique no npm: npm publish --access public

Licença

MIT