Atualmente, o Google está investindo muita energia no desenvolvimento do bot de bate-papo IA Bard e agora deseja dar a eles acesso a grandes quantidades de dados. Uma nova versão lançada recentemente dos Termos de Uso e da Política de Privacidade garante o direito de usar TODOS os dados públicos para análise da Bard. É fundamental que provavelmente não haja possibilidade de exclusão.
Bots de bate-papo AI, como ChatGPT ou Bard, não são apenas treinados a partir de fontes especialmente preparadas, mas também com dados acessíveis ao público do Web – isso já é conhecido há muito tempo. Agora, o Google provavelmente quer se proteger legalmente nesse sentido e tem novos termos de uso publicados. Neles podem ser encontrado o seguinte trecho, com o qual se dá a oportunidade de extrair todos os dados do Web para ser usado para treinar Bard e os serviços Cloud AI:
Por exemplo, coletamos dados disponíveis on-line ou em outras fontes públicas para treinar os modelos de IA do Google e desenvolver produtos e recursos como Google Translate, Bard e Cloud AI. Quando suas informações comerciais aparecem em um site, podemos indexá-las e exibi-las nos serviços do Google.
Que o IA ChatBots com dados do Web ser alimentado há muito é conhecido, como já mencionado, e dificilmente pode ser evitado. Heise aponta que ainda há uma grande diferença em como os dados são processados para pesquisa na web e Bard. Porque embora você possa excluir conteúdo via robots.txt ou outras tecnologias na pesquisa na web, essa possibilidade não é mencionada no Bard. Não é mencionado explicitamente, mas é possível que Bard também use conteúdo que você realmente não deseja indexar.
Quer estas novas disposições criem agora as condições para Bard para finalmente começar na área da UE ou exatamente o contrário, é difícil de classificar. Também é questionável se o acesso total se aplica apenas ao treinamento ou se os dados que não devem ser indexados também são usados na ação.