Total de visualizações de página

quinta-feira, 21 de setembro de 2023

Amazon atualiza Alexa para falar como humanos com apoio de inteligência artificial

 Do site:https://www.tecmundo.com.br/software/271830-amazon-atualiza-alexa-falar-humanos-apoio-inteligencia-artificial.htm


A Alexa entrou no mundo da inteligência artificial (IA) generativa e agora "fala como um humano". A novidade foi compartilhada nesta quarta-feira (20) durante o evento global de dispositivos da Amazon.

Dave Limp, vice-presidente sênior de dispositivos e serviços da Amazon, explica que a "IA generativa está focada em criadores, não em consumidores", por isso a atualização chega com grandes expectativas.

A proposta é simples: você inicia uma conversa com a Alexa e ela responde mais rapidamente, e de forma mais natural. O modelo de linguagem da Amazon é baseado em Speech-to-Speech (fala-para-fala, em tradução livre). Com ele, a Alexa também deve aprender diretamente com as conversas e interações de usuários individuais.

Esse novo grande modelo de linguagem (LLM), que traz uma função chamada "Alexa, let's chat", unifica as interações de texto para fala, que depois faz a "tradução" para o áudio com as respostas, explica Rohit Prasad, vice-presidente e head de ciência na Amazon Artificial General Intelligence.

Com a atualização, a Alexa também deve soar mais como humanos a partir de suas interações. Por exemplo, a assistente poderá dar gargalhadas, se mostrar surpresa e até incluir pausas com "hum…" durante uma conversa.

Um recurso demonstrado pela companhia é justamente a capacidade da "nova Alexa" de continuar conversas de maneira mais prática. Será possível iniciar uma conversa e até parar de falar por algum tempo até voltar ao mesmo tópico. Também será possível interromper uma resposta para adicionar mais contexto ou pedir algo adicional durante uma interação.

A proposta inclui fazer com que o usuário não repita a palavra de ativação "Alexa" o tempo todo, sempre que quiser falar com a assistente. Para isso, existe um novo recurso atrelado ao Visual ID que permite iniciar uma conversa apenas chegando perto da tela, já que ela pode reconhecer rostos. A função é compatível apenas com modelos que possuem tela e câmera.

Alexa mais pessoal

A Alexa baseada no novo modelo de linguagem será disponibilizada para todos os modelos do Echo, incluindo o primeiro, lançado em 2014. No entanto, inicialmente, estará disponível apenas para usuários nos Estados Unidos. Prasad explica que a interação deve ser mais facilitada nos novos modelos, tendo em vista que o processamento de dados é feito nos próprios dispositivos. No entanto, ela também é baseada em nuvem, por isso pode ser utilizada em versões anteriores.

"Nosso novo modelo [de linguagem] foi otimizado especificamente para voz e para coisas que sabemos que nossos consumidores adoram — como ter acesso a informações em tempo real, controlar de maneira eficiente a sua casa inteligente e receber o melhor do seu entretenimento em casa", diz Limp.


Sobre o anúncio, Limp ressalta que a companhia construiu a "nova Alexa" com cinco fundamentos em mente:

  • Conversação: com base em palavras, linguagem corporal, contato visual, gestos e afins;

  • Aplicações para o mundo real: aproximando os LLMs dos usuários "no mundo real, não na aba do seu navegador [de internet]";

  • Personalização: para que as conversas sejam específicas para diferentes usuários, como em famílias;

  • Personalidade: a empresa promete que a Alexa baseada no novo LLM "terá opiniões";

  • Confiabilidade: para proteger a privacidade dos usuários e famílias, e entregar informações de qualidade.

A Alexa também poderá ser explorada por desenvolvedores, que conseguirão utilizar e integrar suas APIs com o LLM. A experiência de adaptação, segundo a companhia, não requer código e deverá ser "simples e rápida". Essa novidade estará disponível a partir do próximo ano.

Inteligência artificial Google Bard agora tem integração com Gmail, Docs, Maps e YouTube

 Do site:https://www.hardware.com.br/noticias/2023-09/inteligencia-artificial-google-bard-agora-tem-integracao-com-gmail-docs-maps-e-youtube.html

Inteligência artificial Google Bard agora tem integração com Gmail, Docs, Maps e YouTube

Você se lembra do Google Bard? A ferramenta de inteligência artificial desenvolvida pela Gigante das Buscas recebeu nesta terça-feira (19) sua maior atualização dos últimos seis meses.

A empresa revelou que a plataforma agora suporta “extensões”, que são módulos que conectam a inteligência artificial a outros serviços digitais da companhia. Agora será viável realizar pesquisas em e-mails do Gmail, em documentos guardados no Google Docs (atualmente conhecido como Workspace), no Google Maps e até em conteúdos do YouTube.

Extensões chegam para “turbinar” o Google Bard

Segundo a companhia, o Google Bard também se integra com dados de hospedagens e voos armazenados no motor de pesquisa.As implementações estão acessíveis no Brasil, contudo, apenas na língua inglesa. A inclusão de outros idiomas acontecerá “em um futuro próximo”, conforme afirmou a empresa, mas sem especificar datas.

A conexão do Bard com outros softwares é denominada de “extensão”. A companhia esclarece que cada serviço pode contribuir com informações relevantes para compor uma resposta mais abrangente.As extensões estão ativas por padrão, mas o usuário pode desabilitá-las a qualquer momento.

Em comunicado enviado à imprensa, a empresa declarou o seguinte:

A gente vive a vida circulando entre diferentes apps e janelas. Com as extensões, porém, o Bard passa a ter uma porção de ‘ajudantes’ que trazem apenas as informações necessárias de cada um desses aplicativos. Assim, em vez de passar horas pesquisando voos e fazendo planos para o dia 12 de junho, basta pedir que o Bard pesquise voos no Dia dos Namorados, floriculturas perto do aeroporto e até escreva um poema para surpreender aquela pessoa especial. Tudo isso numa única conversa.

Como funcionam as extensões?

Ao acessar o Bard, os usuários encontram um novo menu de “Extensões”, onde podem habilitar ou desabilitar AS conexões com os diferentes aplicativos do Google.

As autorizações e solicitações através de prompts de comando podem ser feitas individualmente ou em conjunto. Por exemplo, você pode pedir para o Google Bard abrir o arquivo do Docs sobre lugares para visitar em Curitiba, mostrar esses pontos turísticos no mapa e exibir vídeos do YouTube sobre os melhores passeios da cidade.

Com a melhoria da leitura de imagens pelo chatbot, também é possível usar o Google Lens para identificar objetos. Assim, você pode enviar uma foto de um produto e solicitar ao Bard que mostre um vídeo com um tutorial de instalação, por exemplo. As possibilidades são bem amplas.

Exemplos de comandos usando as extensões

Abaixo você confere alguns exemplos, fornecidos pelo próprio Google, que mostram alguns comandos que ativam a integração com os serviços da empresa.

  • YouTube: Mostre um modelo de como escrever um discurso de padrinho de casamento, e me dê exemplos de vídeos de YouTube que possam ajudar.
  • Mapas: Onde posso levar meu filho de três anos para escolher abóboras de Halloween, e me dê ideias de artes inspiradas no outono que a gente possa fazer em casa.
  • Gmail: Faça um resumo das últimas entrevistas que marquei para visitar e conhecer escolas, e coloque as informações numa tabela, com data e horário.
  • Drive: Encontre no meu Drive o mais recente contrato de aluguel e verifique o valor do depósito caução que eu já realizei
  • YouTube + Mapas: Encontre hotéis em Paris para uma semana em novembro, e vídeos sobre programas legais para fazer com crianças quando eu estiver lá.
  • YouTube + Lens: Esta é a cadeirinha de bebê que comprei para o carro. Me mostre o vídeo com o tutorial de instalação da cadeirinha.
  • Gmail + Voos + Hotéis + Mapas + YouTube: Quais são as datas propostas pelo Erik no e-mail sobre a caminhada que vamos fazer na viagem ao Grand Canyon? // Mostre voos para Phoenix nas datas propostas,e mostre hotéis próximos à entrada do Parque Nacional Grand Canyon // Crie um itinerário para a caminhada no Grand Canyon, de ponta a ponta, e inclua uma sugestão de lista de bagagem.

Privacidade dos usuários e confiabilidade das respostas

Em uma coletiva de imprensa onde executivos do Google esclareceram questionamentos de jornalistas, Patrick Kane, diretor de produtos do Google, foi questionado sobre a segurança dos dados pessoais.

Kane assegurou que nenhuma interação com o Google Workspace é analisada por seres humanos, não será empregada em campanhas publicitárias futuras e tampouco para aprimorar o Bard.

Um dos principais desenvolvedores do Google Bard também afirmou que a meta da empresa é reforçar os métodos para que os usuários verifiquem as informações fornecidas pelo Bard. Com base no feedback dos usuários, a plataforma agora mostra um ícone de “G” que indica rapidamente o grau de confiabilidade de cada segmento do texto gerado pela IA.

Isso significa que o Google Bard agora torna mais transparente a origem das informações. As demonstrações da empresa exibiam citações com um fundo verde, por exemplo. Ao clicar na frase, o sistema revelava o site de onde aquelas informações haviam sido tiradas. Segmentos com fundo laranja não possuíam uma fonte clara, o que poderia indicar uma falha do sistema ou informações imprecisas.

A empresa não forneceu informações sobre como pretende remunerar os sites cujo conteúdo é reutilizado e mostrado pela inteligência artificial.