Sumário
Os sistemas de IA são treinados com uma ampla gama de dados. Muitas vezes, isso inclui informações pessoais. O aprendizado de máquina distribuído pode melhorar a proteção de dados no desenvolvimento de IA, pois os dados usados são processados nos dispositivos dos usuários, e não em um servidor central. No entanto, também existem mais pontos de entrada em potencial para invasores. A plataforma alemã “Learning Systems” (sistemas de aprendizagem) fornece uma visão geral em sua edição atual de “AI at a glance”.
No aprendizado de máquina distribuído, cada dispositivo final acessa o modelo atual e o treina localmente com seu próprio conjunto de dados. Dados pessoais potenciais, portanto, não precisam ser processados por meio de um servidor central.
Para atualizar e melhorar o modelo de ML, não os dados reais, mas apenas os resultados do treinamento (chamados de pesos) são compartilhados com outros dispositivos finais. Existem três abordagens técnicas para aprendizado de máquina distribuído.
Aprendizagem Dividida
No aprendizado dividido, o modelo de IA é treinado nos endpoints e no servidor.
- O modelo ML é dividido em diferentes submodelos (os chamados links) e treinado nos dispositivos finais (clientes) e no servidor sem compartilhar dados brutos (distribuição eficiente da carga computacional)
- Processo de treinamento iterativo: no ponto de divisão do modelo ML (chamado de camada dividida), os dispositivos finais e servidores trocam apenas resultados (pesos) da seção do modelo ML treinado (em vez de dados brutos) e continuam treinando com esses resultados por conta própria conjunto de dados (menores custos de comunicação).
- As iterações terminam quando a convergência entre os modelos ML dos dispositivos finais e o servidor é alcançada.
Aprendizagem federada
No aprendizado federado, um servidor central atua como uma instância de agregação para pesos.
- Os dispositivos finais baixam os parâmetros do modelo ML do servidor
- O modelo de ML é treinado por dispositivos finais com conjunto de dados local
- Dispositivos finais apenas enviam pesos para o servidor; o conjunto de dados local permanece com o dispositivo final
- Nenhum treinamento ocorre no servidor, apenas a composição dos pesos
para atualização central do modelo ML (inferência) - O servidor fornece parâmetros do modelo de ML aprimorado, porque sincronizado, para dispositivos finais para novos treinamentos
- O processo pode ser repetido quantas vezes forem necessárias, com o modelo de ML distribuído constantemente otimizando-se ainda mais
Enxame de Aprendizagem
No aprendizado de enxame, um modelo de IA é treinado em dispositivos distribuídos sem uma instância central de agregação.
- Os parâmetros do modelo ML são armazenados em um blockchain de acesso restrito em vez de em um servidor central
- Nenhuma instância de coordenação, mas uma instância central para a pré-autorização de dispositivos finais necessários para acesso ao blockchain
- Dispositivos finais carregam parâmetros do modelo ML do blockchain e podem treiná-lo com um conjunto de dados local
- Após o treino, apenas os pesos ajustados são armazenados na blockchain
- Pesos e parâmetros ajustados do modelo ML podem ser lidos por dispositivos finais e montados localmente para formar o modelo geral
Exemplos de aplicativos para aprendizado de máquina distribuído
Uma aplicação potencial para aprendizagem dividida é o reconhecimento de imagem para direção autônoma. A melhoria contínua de um modelo básico de reconhecimento de imagem pode ser distribuída entre muitos veículos, cada um dos quais usa seus dados de sensor para refinar o modelo. Eles então fornecem os parâmetros treinados localmente para o modelo básico no servidor central para treinamento adicional. Desta forma, a rota relevante para a privacidade é processada inteiramente localmente.
Outro exemplo é o treinamento local de modelos de IA para preenchimento e correção automática de smartphones. Através aprendizagem federada, apenas os pesos do modelo são compartilhados com o servidor central. Textos escritos com o smartphone, que podem dar pistas sobre situações da vida ou até mesmo revelar segredos da empresa, permanecem no aparelho.
Enxame de aprendizagem poderia ajudar a diagnosticar doenças sem preocupações com a privacidade. O modelo de diagnóstico é distribuído no blockchain para várias clínicas licenciadas por meio de planos de saúde. Os parâmetros do modelo central são recuperados pelas clínicas, mesclados localmente em um modelo geral e treinados com dados de saúde locais. Os parâmetros do modelo atualizado são então sincronizados de volta ao blockchain. Informações pessoais medicamente sensíveis não são transferidas.
Vantagens e desvantagens do aprendizado de máquina distribuído
“O aprendizado de máquina distribuído abre novas possibilidades para o uso eficaz e escalável de dados sem a necessidade de compartilhá-los. Isso permite que muitos aplicativos úteis com dados confidenciais sejam possíveis em primeiro lugar”, diz Ahmad-Reza Sadeghi, professor de ciência da computação na Darmstadt University of Technology e membro do grupo de trabalho de segurança e privacidade de TI do Plattform Lernende Systeme.
Mas também há desafios: a distribuição de dados e processos de treinamento em muitos endpoints cria novos gateways para invasores. Além disso, o aprendizado de máquina distribuído requer uma conexão com a Internet para troca de parâmetros, o que pode levar a instabilidades.
As atualizações do modelo permitem tirar conclusões sobre os dados pessoais. Além disso, dados de pessoas individuais podem ser identificados no conjunto de dados de treinamento. O gráfico a seguir fornece uma visão geral das vantagens e desvantagens.