Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Agora vamos discuti-los em detalhes, um por um.

image-20241111-034709.png

image-20241111-032819.png

Criar conclusão de

...

bate-papo - ChatGPT

A conclusão de chat oferece uma funcionalidade de envio de prompts para o OpenAI em formato textual e com base no prompt que recebe uma resposta.

Entrada:

...

Prompt : Esta é sua entrada principal para a qual você quer que a IA lhe dê uma resposta ou saída. Pode ser uma pergunta, uma instrução, etc.

Modelo: O modelo que você quer usar dentro do OpenAI para a tarefa. Por padrão, text-DaVinci-003 foi selecionado.

Max Tokens : Cada tarefa dentro do OpenAI consome tokens. Esses tokens podem ser repostos usando crédito. Este campo coloca um limite no número máximo de tokens que você deseja usar para uma tarefa específica.

...

Temperatura : Isso atua como um medidor de precisão, onde valores mais altos dão respostas mais aleatórias e valores mais baixos dão respostas mais determinísticas e focadas. O padrão é 1

Presence Penalty : Este valor faz com que o OpenAI use frases e textos únicos ao concluir uma tarefa. Quanto maior o valor, menos repetitivas as palavras. O padrão é 0.

Número de Conclusões : O número de vezes que você quer que a IA gere uma resposta com base no seu prompt. O valor mais alto resultará em mais respostas. O padrão é 1 para evitar o consumo de tokens.

Melhor das Conclusões : Isso retorna a(s) melhor(es) resposta(s) possível(eis) para seu prompt. O padrão é 1. Isso funciona com o campo Número de Conclusões para escolher a melhor resposta possível de um grupo de respostas.

Resposta:

...

Mapear a resposta para o campo personalizado

Você pode selecionar o texto nas opções e, em seguida, ver o caminho JSON selecionado. Depois, você pode salvar a resposta no seu próprio campo personalizado do usuário e, então, usar essa resposta no seu criador de fluxo.

Dados de resposta de amostra

Code Block
{
"id": "cmpl-6zchlUy0OiAjX91LHOPBcZjuXaDgE",
"object": "text_completion",
"created": 1680144809,
"model": "text-davinci-003",
"choices": [
{
"text": " 1. Understand Your Target Audience - Before you begin any marketing campaign, it’s important to have a clear understanding of who you’re targeting with your message. Researching and understanding your target audience will help you create campaigns specifically tailored to their interests. 2. Leverage Social Media - Social media has become one of the most effective ways to communicate with your target audience. Utilizing social media channels such as Facebook, Twitter, and Instagram can help you build",
"index": 0,
"logprobs": null,
"finish_reason": "length"
}
],
"usage": {
"prompt_tokens": 4,
"completion_tokens": 100,
"total_tokens": 104
}
}

 

Id : O id da conclusão do texto. Um valor único.

Objeto : A ação/tarefa que você deu ao OpenAI. No nosso caso “text_completion”

Created : Um campo de data e hora que informa a instância da criação da resposta. Está no formato Unix timestamp.

Motivo da conclusão : O motivo da interrupção da referida tarefa.

Tokens de prompt : O número de tokens usados ​​para concluir a tarefa.

Melhores Práticas:

Às vezes, a resposta completa que você recebe parece estar cortada. Isso ocorre devido à falta do número de tokens necessários para a conclusão da tarefa. Simplesmente ajustar o valor de Max tokens dentro dos campos de entrada corrigirá esse problema.

Também é aconselhável ajustar valores como temperatura, número de conclusões, melhor das conclusões, etc. para seu caso de uso por meio de testes de divisão. Cada caso de uso é único e você deve querer a melhor utilização possível dos recursos disponíveis.

Geração de Imagem

Image Generation é usado para gerar imagens com base nos prompts de entrada do usuário. Este recurso gerará a melhor imagem possível que corresponda ao seu prompt fornecido.

Entrada:

...

Prompt : Esta é sua entrada principal para a qual você quer que a IA gere uma imagem para você. Pode ser uma pergunta, uma instrução etc.

Número de Imagens : O número de imagens que você quer que a IA gere para você. O padrão é 1

Tamanho : As dimensões que você quer que a imagem tenha. O OpenAI suporta três tamanhos que são: 

           512x512 

           256x256

           1024x1024

Resposta:

...

Dados de resposta de amostra

Code Block
{
"created": 1680145479,
"data": [
{
"url": "https://oaidalleapiprodscus.blob.core.windows.net/private/org-2FEbJIRL7GXfKmGw2BT9wh9b/user-nk6UUN7L9nFqzGEw67uTMonD/img-FhZpxMrCbiDBR4O62e7pPF08.png?st=2023-03-30T02%3A04%3A39Z&se=2023-03-30T04%3A04%3A39Z&sp=r&sv=2021-08-06&sr=b&rscd=inline&rsct=image/png&skoid=6aaadede-4fb3-4698-a8f6-684d7786b067&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2023-03-29T17%3A40%3A49Z&ske=2023-03-30T17%3A40%3A49Z&sks=b&skv=2021-08-06&sig=4DF0dw/peG7FSVMUml4ShuQP98T0xECW1gE%2BeutdRAw%3D"
}
]
}

Criado : Um campo de data e hora que informa a instância de criação da resposta. Está no formato Unix timestamp.

Url : A URL pública para sua(s) imagem(ns).

Melhores Práticas:

A geração de imagens consome mais poder computacional e, portanto, as respostas podem ser atrasadas com base nos prompts fornecidos.

A IA é um campo em desenvolvimento e, portanto, as imagens produzidas podem ser bastante imprecisas, dada a complexidade dos prompts fornecidos. Portanto, encontrar a complexidade correta do prompt pode, às vezes, ser um desafio.

Fala para texto

A ação de fala para texto é usada quando você quer converter entrada de áudio em texto. Isso tem uma variedade de casos de uso, como implementação em IVRs.

Entrada:

...

File Url : Esta é a URL para o áudio que você quer converter para texto. Certifique-se de que a url seja uma url pública hospedada terminando com formatos de áudio como mp3, mpeg etc.

Note

Observe que a URL precisa começar com https:// e terminar com mp3, ou mp4, mpeg, mpga, m4a, wav, webm

Idioma : O idioma para o qual você quer que o discurso seja convertido. Usamos o formato ISO-639-1, o que significa que você precisa colocar idiomas como 'en', 'es' etc.

Resposta:

...

Dados de resposta de amostra

Code Block
{
"text": "Welcome to Rensen. This is a test to see if everything works well. And if the IVR can guide you to your work."
}

 

Texto : O texto que é convertido do discurso.

Melhores Práticas:

Você pode converter fala em texto com bastante precisão usando esse recurso. É considerado uma prática recomendada fornecer o áudio no mesmo idioma da saída desejada para resultados e latência mais precisos.

Traduzir áudio para inglês

A ação Translate audio to English é usada quando você quer converter entrada de áudio em texto no idioma inglês. Isso tem uma variedade de casos de uso, como implementação em IVRs.

Entrada:

...

File Url : Esta é a URL para o áudio que você quer converter para texto. Certifique-se de que a url seja uma url pública hospedada terminando com formatos de áudio como mp3, mpeg etc.

Note

Observe que a URL precisa começar com https:// e terminar com mp3, ou mp4, mpeg, mpga, m4a, wav, webm

Resposta:

...

Dados de resposta de amostra

Code Block
{
"text": "Welcome to Rensen. This is a test to see if everything works well. And if the IVR can guide you to your work."
}

 

Texto : O texto que é convertido do discurso.

 

Melhores Práticas:

Experimentar diferentes formatos de áudio pode fornecer resultados mais (ou menos) precisos. Isso se deve simplesmente à qualidade do áudio fornecido, então certifique-se de fazer testes A/B com diferentes formatos para obter o melhor formato possível para seu caso de uso.

Criar conclusão de bate-papo - ChatGPT

A conclusão de chat oferece uma funcionalidade de envio de prompts para o OpenAI em formato textual e com base no prompt recebe uma resposta. Isso é semelhante à ação de conclusão de texto, mas usa o ChatGPT, que é 10x mais rápido e mais barato também.

Input:

...

Mensagem do sistema: Este é um campo opcional e é usado para fornecer contexto adicional sobre você ou sua empresa ao concluir chats.

Você pode configurar informações de fundo detalhadas como esta se estiver criando um chatbot de restaurante:

Exemplo de mensagem do sistema

Você é um assistente da loja Modelo da WiiChat. Você cuidará do suporte ao cliente e orientará o usuário e fará reservas. O horário de funcionamento do restaurante é das 9h às 20h, de segunda a sábado. Não são permitidos animais de estimação. Sempre ofereça o código do cupom se achar que é um bom momento para fazê-lo.

Isso permitirá que você configure facilmente informações de fundo sobre o chatbot, e ele pode atender seu cliente com base nas informações que você instruiu.

Mensagem: Esta é sua entrada principal para a qual você deseja que a IA lhe dê uma resposta ou saída. Normalmente, esta é a resposta do usuário. Pode ser uma pergunta, uma instrução, etc. Você pode adicionar “usuário:” como um prefixo ao seu prompt para fornecer mais contexto à IA, por exemplo:

“usuário: vai chover hoje?”

Também funcionará se você não adicionar "usuário" na frente da resposta. Você pode usar nosso campo de sistema como {{last_text_input}}

...

Lembrar histórico: se selecionado "Sim", o histórico de bate-papo entre o usuário e o assistente será salvo em um campo de sistema para ser usado posteriormente, se necessário.

A resposta da ação do openAI será salva automaticamente na função de assistente. Você não precisa fazer nada.

Além disso, introduzimos um novo campo JSON do sistema: {{openAI}} que terá todo o histórico de bate-papo com o usuário:

Você pode encontrar o campo do sistema openAI no seu perfil de usuário. Este JSON salvará a configuração do sistema e todo o histórico de bate-papo.

...

Note

Observe que nossos limites de tamanho de campo JSON são 20.000, se o histórico de bate-papo tiver mais de 20.000 caracteres, excluiremos do histórico de bate-papo mais antigo para manter o histórico de bate-papo dentro dos limites.

Modelo: o modelo que você deseja usar dentro do ChatGPT para a tarefa. Por padrão, gpt-4o-mini foi selecionado.

Máximo de tokens: cada tarefa dentro do ChatGPT consome tokens. Esses tokens podem ser repostos usando o crédito. Este campo coloca um limite no número máximo de tokens que você deseja usar para uma tarefa específica.

Temperatura: isso atua como um medidor de precisão, onde valores mais altos fornecem respostas mais aleatórias e valores mais baixos fornecem respostas mais determinísticas e focadas. O padrão é 1

Penalidade de presença: este valor faz com que o ChatGPT use frases e textos exclusivos ao concluir uma tarefa. Quanto maior o valor, menos palavras repetitivas. O padrão é 0.

...

Número de Conclusões : O número de vezes que você quer que a IA gere uma resposta com base no seu prompt. O valor mais alto resultará em mais respostas. O padrão é 1 para evitar o consumo de tokens.

Melhor das Conclusões : Isso retorna a(s) melhor(es) resposta(s) possível(eis) para seu prompt. O padrão é 1. Isso funciona com o campo Número de Conclusões para escolher a melhor resposta possível de um grupo de respostas.

...

Resposta:

...

Dados de resposta de amostra

Code Block
{
"id": "chatcmpl-ASFcU2w2vUrh8uJZ8Va75qv0dqDsA",
"object": "chat.completion",
"created": 1731296590,
"model": "gpt-4o-mini-2024-07-18",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "Claro! Para integrar o WhatsApp Cloud API na nossa plataforma de chatbot, você pode seguir o guia completo que preparamos. Ele contém um passo a passo detalhado sobre como realizar essa conexão. Você pode acessá-lo aqui: https://wiichat.atlassian.net/wiki/spaces/KB/pages/1933701/Conex+o+com+WhatsApp+Cloud+API. Se precisar de mais informações sobre integrações em geral, recomendo visitar nossa página de integrações: https://www.wiichat.com.br/integracoes. Se precisar de mais alguma coisa, estou à disposição! 😊",
"refusal": null
},
"logprobs": null,
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 791,
"completion_tokens": 126,
"total_tokens": 917,
"prompt_tokens_details": {
"cached_tokens": 0,
"audio_tokens": 0
},
"completion_tokens_details": {
"reasoning_tokens": 0,
"audio_tokens": 0,
"accepted_prediction_tokens": 0,
"rejected_prediction_tokens": 0
}
},

 

Id : O id da conclusão do texto. Um valor único.

Objeto : A ação/tarefa que você deu ao OpenAI. No nosso caso “text_completion”

Criado : Um campo de data e hora que informa a instância de criação da resposta. Está no formato Unix timestamp.

Escolha -> Conteúdo: O campo de conteúdo dentro do objeto de escolha contém a resposta ao seu prompt.

Mensagem: Este é um JSON para a conversa completa que ocorreu entre o usuário e o assistente.

...

Melhores Práticas:

A ação de conclusão de bate-papo também permite que você forneça uma entrada JSON. Assim, você pode salvar a conversa completa entre os usuários e o assistente em um JSON para fornecer respostas mais focadas e contextuais relacionadas a essa conversa.

...

Isso é semelhante à ação de conclusão de texto, mas usa o ChatGPT, que é 10x mais rápido e mais barato também.

Input:

...

Mensagem do sistema: Este é um campo opcional e é usado para fornecer contexto adicional sobre você ou sua empresa ao concluir chats.

Você pode configurar informações de fundo detalhadas como esta se estiver criando um chatbot de restaurante:

Exemplo de mensagem do sistema

Você é um assistente da loja Modelo da WiiChat. Você cuidará do suporte ao cliente e orientará o usuário e fará reservas. O horário de funcionamento do restaurante é das 9h às 20h, de segunda a sábado. Não são permitidos animais de estimação. Sempre ofereça o código do cupom se achar que é um bom momento para fazê-lo.

Isso permitirá que você configure facilmente informações de fundo sobre o chatbot, e ele pode atender seu cliente com base nas informações que você instruiu.

Mensagem: Esta é sua entrada principal para a qual você deseja que a IA lhe dê uma resposta ou saída. Normalmente, esta é a resposta do usuário. Pode ser uma pergunta, uma instrução, etc. Você pode adicionar “usuário:” como um prefixo ao seu prompt para fornecer mais contexto à IA, por exemplo:

“usuário: vai chover hoje?”

Também funcionará se você não adicionar "usuário" na frente da resposta. Você pode usar nosso campo de sistema como {{last_text_input}}

...

Lembrar histórico: se selecionado "Sim", o histórico de bate-papo entre o usuário e o assistente será salvo em um campo de sistema para ser usado posteriormente, se necessário.

A resposta da ação do openAI será salva automaticamente na função de assistente. Você não precisa fazer nada.

Além disso, introduzimos um novo campo JSON do sistema: {{openAI}} que terá todo o histórico de bate-papo com o usuário:

Você pode encontrar o campo do sistema openAI no seu perfil de usuário. Este JSON salvará a configuração do sistema e todo o histórico de bate-papo.

...

Note

Observe que nossos limites de tamanho de campo JSON são 20.000, se o histórico de bate-papo tiver mais de 20.000 caracteres, excluiremos do histórico de bate-papo mais antigo para manter o histórico de bate-papo dentro dos limites.

Modelo: o modelo que você deseja usar dentro do ChatGPT para a tarefa. Por padrão, gpt-4o-mini foi selecionado.

Máximo de tokens: cada tarefa dentro do ChatGPT consome tokens. Esses tokens podem ser repostos usando o crédito. Este campo coloca um limite no número máximo de tokens que você deseja usar para uma tarefa específica.

Temperatura: isso atua como um medidor de precisão, onde valores mais altos fornecem respostas mais aleatórias e valores mais baixos fornecem respostas mais determinísticas e focadas. O padrão é 1

Penalidade de presença: este valor faz com que o ChatGPT use frases e textos exclusivos ao concluir uma tarefa. Quanto maior o valor, menos palavras repetitivas. O padrão é 0.

...

Número de Conclusões : O número de vezes que você quer que a IA gere uma resposta com base no seu prompt. O valor mais alto resultará em mais respostas. O padrão é 1 para evitar o consumo de tokens.

Melhor das Conclusões : Isso retorna a(s) melhor(es) resposta(s) possível(eis) para seu prompt. O padrão é 1. Isso funciona com o campo Número de Conclusões para escolher a melhor resposta possível de um grupo de respostas.

...

Resposta:

...

Dados de resposta de amostra

Code Block
{
"id": "chatcmpl-ASFcU2w2vUrh8uJZ8Va75qv0dqDsA",
"object": "chat.completion",
"created": 1731296590,
"model": "gpt-4o-mini-2024-07-18",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "Claro! Para integrar o WhatsApp Cloud API na nossa plataforma de chatbot, você pode seguir o guia completo que preparamos. Ele contém um passo a passo detalhado sobre como realizar essa conexão. Você pode acessá-lo aqui: https://wiichat.atlassian.net/wiki/spaces/KB/pages/1933701/Conex+o+com+WhatsApp+Cloud+API. Se precisar de mais informações sobre integrações em geral, recomendo visitar nossa página de integrações: https://www.wiichat.com.br/integracoes. Se precisar de mais alguma coisa, estou à disposição! 😊",
"refusal": null
},
"logprobs": null,
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 791,
"completion_tokens": 126,
"total_tokens": 917,
"prompt_tokens_details": {
"cached_tokens": 0,
"audio_tokens": 0
},
"completion_tokens_details": {
"reasoning_tokens": 0,
"audio_tokens": 0,
"accepted_prediction_tokens": 0,
"rejected_prediction_tokens": 0
}
},

 

Id : O id da conclusão do texto. Um valor único.

Objeto : A ação/tarefa que você deu ao OpenAI. No nosso caso “text_completion”

Criado : Um campo de data e hora que informa a instância de criação da resposta. Está no formato Unix timestamp.

Escolha -> Conteúdo: O campo de conteúdo dentro do objeto de escolha contém a resposta ao seu prompt.

Mensagem: Este é um JSON para a conversa completa que ocorreu entre o usuário e o assistente.

...

Após isso, clique em salvar. O conteúdo gerado será salvo na variável definida. Depois, basta colocar a variável em um bloco de texto de mensagem, como no exemplo abaixo.

...

Melhores Práticas:

A ação de conclusão de bate-papo também permite que você forneça uma entrada JSON. Assim, você pode salvar a conversa completa entre os usuários e o assistente em um JSON para fornecer respostas mais focadas e contextuais relacionadas a essa conversa.

Note

Como a conclusão do bate-papo exige mais entrada, o consumo de tokens pode ser maior que a conclusão de texto.

Criar conclusão de Texto

O preenchimento automático de texto oferece a funcionalidade de enviar prompts para o OpenAI em formato textual e com base no prompt que recebe uma resposta.

Entrada:

...

Prompt : Esta é sua entrada principal para a qual você quer que a IA lhe dê uma resposta ou saída. Pode ser uma pergunta, uma instrução, etc.

Modelo: O modelo que você quer usar dentro do OpenAI para a tarefa. Por padrão, text-DaVinci-003 foi selecionado.

Max Tokens : Cada tarefa dentro do OpenAI consome tokens. Esses tokens podem ser repostos usando crédito. Este campo coloca um limite no número máximo de tokens que você deseja usar para uma tarefa específica.

...

Temperatura : Isso atua como um medidor de precisão, onde valores mais altos dão respostas mais aleatórias e valores mais baixos dão respostas mais determinísticas e focadas. O padrão é 1

Presence Penalty : Este valor faz com que o OpenAI use frases e textos únicos ao concluir uma tarefa. Quanto maior o valor, menos repetitivas as palavras. O padrão é 0.

Número de Conclusões : O número de vezes que você quer que a IA gere uma resposta com base no seu prompt. O valor mais alto resultará em mais respostas. O padrão é 1 para evitar o consumo de tokens.

Melhor das Conclusões : Isso retorna a(s) melhor(es) resposta(s) possível(eis) para seu prompt. O padrão é 1. Isso funciona com o campo Número de Conclusões para escolher a melhor resposta possível de um grupo de respostas.

Resposta:

...

Mapear a resposta para o campo personalizado

Você pode selecionar o texto nas opções e, em seguida, ver o caminho JSON selecionado. Depois, você pode salvar a resposta no seu próprio campo personalizado do usuário e, então, usar essa resposta no seu criador de fluxo.

Dados de resposta de amostra

Code Block
{
"id": "cmpl-6zchlUy0OiAjX91LHOPBcZjuXaDgE",
"object": "text_completion",
"created": 1680144809,
"model": "text-davinci-003",
"choices": [
{
"text": " 1. Understand Your Target Audience - Before you begin any marketing campaign, it’s important to have a clear understanding of who you’re targeting with your message. Researching and understanding your target audience will help you create campaigns specifically tailored to their interests. 2. Leverage Social Media - Social media has become one of the most effective ways to communicate with your target audience. Utilizing social media channels such as Facebook, Twitter, and Instagram can help you build",
"index": 0,
"logprobs": null,
"finish_reason": "length"
}
],
"usage": {
"prompt_tokens": 4,
"completion_tokens": 100,
"total_tokens": 104
}
}

 

Id : O id da conclusão do texto. Um valor único.

Objeto : A ação/tarefa que você deu ao OpenAI. No nosso caso “text_completion”

Created : Um campo de data e hora que informa a instância da criação da resposta. Está no formato Unix timestamp.

Motivo da conclusão : O motivo da interrupção da referida tarefa.

Tokens de prompt : O número de tokens usados ​​para concluir a tarefa.

Melhores Práticas:

Às vezes, a resposta completa que você recebe parece estar cortada. Isso ocorre devido à falta do número de tokens necessários para a conclusão da tarefa. Simplesmente ajustar o valor de Max tokens dentro dos campos de entrada corrigirá esse problema.

Também é aconselhável ajustar valores como temperatura, número de conclusões, melhor das conclusões, etc. para seu caso de uso por meio de testes de divisão. Cada caso de uso é único e você deve querer a melhor utilização possível dos recursos disponíveis.

Geração de Imagem

Image Generation é usado para gerar imagens com base nos prompts de entrada do usuário. Este recurso gerará a melhor imagem possível que corresponda ao seu prompt fornecido.

Entrada:

...

Prompt : Esta é sua entrada principal para a qual você quer que a IA gere uma imagem para você. Pode ser uma pergunta, uma instrução etc.

Número de Imagens : O número de imagens que você quer que a IA gere para você. O padrão é 1

Tamanho : As dimensões que você quer que a imagem tenha. O OpenAI suporta três tamanhos que são: 

           512x512 

           256x256

           1024x1024

Resposta:

...

Dados de resposta de amostra

Code Block
{
"created": 1680145479,
"data": [
{
"url": "https://oaidalleapiprodscus.blob.core.windows.net/private/org-2FEbJIRL7GXfKmGw2BT9wh9b/user-nk6UUN7L9nFqzGEw67uTMonD/img-FhZpxMrCbiDBR4O62e7pPF08.png?st=2023-03-30T02%3A04%3A39Z&se=2023-03-30T04%3A04%3A39Z&sp=r&sv=2021-08-06&sr=b&rscd=inline&rsct=image/png&skoid=6aaadede-4fb3-4698-a8f6-684d7786b067&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2023-03-29T17%3A40%3A49Z&ske=2023-03-30T17%3A40%3A49Z&sks=b&skv=2021-08-06&sig=4DF0dw/peG7FSVMUml4ShuQP98T0xECW1gE%2BeutdRAw%3D"
}
]
}

Criado : Um campo de data e hora que informa a instância de criação da resposta. Está no formato Unix timestamp.

Url : A URL pública para sua(s) imagem(ns).

Melhores Práticas:

A geração de imagens consome mais poder computacional e, portanto, as respostas podem ser atrasadas com base nos prompts fornecidos.

A IA é um campo em desenvolvimento e, portanto, as imagens produzidas podem ser bastante imprecisas, dada a complexidade dos prompts fornecidos. Portanto, encontrar a complexidade correta do prompt pode, às vezes, ser um desafio.

Fala para texto

A ação de fala para texto é usada quando você quer converter entrada de áudio em texto. Isso tem uma variedade de casos de uso, como implementação em IVRs.

Entrada:

...

File Url : Esta é a URL para o áudio que você quer converter para texto. Certifique-se de que a url seja uma url pública hospedada terminando com formatos de áudio como mp3, mpeg etc.

Note

Observe que a URL precisa começar com https:// e terminar com mp3, ou mp4, mpeg, mpga, m4a, wav, webm

Idioma : O idioma para o qual você quer que o discurso seja convertido. Usamos o formato ISO-639-1, o que significa que você precisa colocar idiomas como 'en', 'es' etc.

Resposta:

...

Dados de resposta de amostra

Code Block
{
"text": "Welcome to Rensen. This is a test to see if everything works well. And if the IVR can guide you to your work."
}

 

Texto : O texto que é convertido do discurso.

Melhores Práticas:

Você pode converter fala em texto com bastante precisão usando esse recurso. É considerado uma prática recomendada fornecer o áudio no mesmo idioma da saída desejada para resultados e latência mais precisos.

Traduzir áudio para inglês

A ação Translate audio to English é usada quando você quer converter entrada de áudio em texto no idioma inglês. Isso tem uma variedade de casos de uso, como implementação em IVRs.

Entrada:

...

File Url : Esta é a URL para o áudio que você quer converter para texto. Certifique-se de que a url seja uma url pública hospedada terminando com formatos de áudio como mp3, mpeg etc.

Note

Observe que a URL precisa começar com https:// e terminar com mp3, ou mp4, mpeg, mpga, m4a, wav, webm

Resposta:

...

Dados de resposta de amostra

Code Block
{
"text": "Welcome to Rensen. This is a test to see if everything works well. And if the IVR can guide you to your work."
}

 

Texto : O texto que é convertido do discurso.

 

Melhores Práticas:

Experimentar diferentes formatos de áudio pode fornecer resultados mais (ou menos) precisos. Isso se deve simplesmente à qualidade do áudio fornecido, então certifique-se de fazer testes A/B com diferentes formatos para obter o melhor formato possível para seu caso de uso.

Casos de usuário: ChatGPT

...