Conheça a diferença entre Deep Learning e Reinforcement Learning

As várias tecnologias de ponta relacionadas à inteligência artificial (IA) são o foco da atenção ultimamente. Na proporção que a quantidade de dados gerados continua a crescer a níveis incalculáveis, nossa maturidade em IA e os problemas potenciais que ela pode ajudar a resolver crescem junto. Essas informações, junto ao incrível poder de processamento, que agora está disponível a um custo razoável, são o que alimenta o crescimento das tecnologias de IA e possibilita o Deep Learning (aprendizado profundo) e Reinforcement Learning (aprendizado por reforço).

VEJA TAMBÉM: Inteligência Artificial será usada em tratamento para o câncer

Com as rápidas mudanças na indústria de inteligência artificial, pode ser desafiador acompanhar as mais recentes tecnologias de ponta.

Tanto o Deep Learning quanto o Reinforcement Learning são funções de Machine Mearning (aprendizado de máquina), que por sua vez fazem parte de um conjunto mais amplo de ferramentas de inteligência artificial.

O que torna ambas as ferramentas interessantes é a possibilidade de um equipamento desenvolver regras por conta própria para resolver problemas. Essa capacidade de aprender não é novidade para os computadores, mas até recentemente não havia dados nem o poder de processamento para os tornar ferramentas cotidianas.

Acompanhe na galeria de imagens abaixo, as definições e diferenças entre Deep Learning (DL) e reinforcement learning (RL):

  • O que é Deep Learning?

    Deep Learning é essencialmente um sistema autônomo de auto-aprendizagem no qual você usa informações existentes para treinar algoritmos e encontrar padrões. Os resultados obtidos são usados como previsões sobre novos dados.

    Por exemplo, é possível treinar um algoritmo de DL para reconhecer gatos em uma fotografia, apenas ao alimentar milhões de imagens com e sem gatos. O programa então estabelecerá padrões de classificação e agrupamento dos dados da foto (arestas, formatos, cores, distâncias entre as formas etc.). O modelo criado com base nos dados de treinamento passa a funcionar de forma preditiva, capaz de examinar novos conjuntos de arquivos e prever se elas contêm gatos ou não.

    Algoritmos de DL fazem isso por meio de várias camadas de redes neurais artificiais, que imitam a ligação de neurônios em nosso cérebro. Isso permite a execução de vários ciclos para diminuir os padrões e melhorar as previsões a cada nova tentativa.

    Um ótimo exemplo de DL na prática é o Face ID da Apple. Ao configurar seu telefone, você treina o algoritmo com a varredura do seu rosto. A cada logon, a câmera TrueDepth captura milhares de pontos de dados que criam um mapa de profundidade da face. Na sequência, o mecanismo neural embutido no telefone executa a análise para prever se é o dono do smartphone ou não.

  • O que é Reinforcement Learning?

    O RL é um sistema autônomo de autoaprendizagem que assimila a informação por tentativa e erro. As ações são realizadas com o objetivo de maximizar recompensas, ou seja, aprender na prática para obter os melhores resultados.

    O recurso funciona de forma semelhante ao modo como aprendemos a andar de bicicleta: no começo caímos muito e fazemos movimentos​​ muitas vezes erráticos, mas ao longo do tempo entendemos o que funcionou ou não e usamos essas percepções para ajustar nosso desempenho.

    O mesmo acontece quando os computadores usam RL. Eles tentam ações diferentes, aprendem com o feedback se essa ação gerou um resultado melhor e a reforçam. Ou seja, refazem e modificam algoritmos de forma autônoma em várias repetições até tomar decisões que entreguem melhores resultados.

    Um bom exemplo do uso de RL é um robô aprendendo a andar. A máquina primeiro tenta um grande passo à frente e cai. O resultado de uma queda com esse grande passo é um ponto de dados ao qual o sistema de aprendizagem responde. Como o feedback foi negativo, o sistema ajusta a ação para tentar uma passada menor, e assim por diante até o sistema assimilar o padrão correto da ação.

    Um dos exemplos mais fascinantes de RL foi a aplicação da ferramenta Deep Mind do Google a jogos clássicos de computador da Atari, como o Break Out. O objetivo (ou recompensa) era maximizar a pontuação, e as ações consistiam em mover a barra na parte inferior da tela para devolver a bola de volta para o jogo e quebrar os tijolos na parte superior.

  • Diferença entre DL e RL

    Deep Learning e Reinforcement Learning são sistemas que aprendem autonomamente. A diferença entre eles é que o DL aprende a partir de uma bateria de treinamentos e depois aplica o conhecimento adquirido a um novo conjunto de dados. Já o RL aprende dinamicamente com o ajuste das ações e o feedback contínuo para maximizar uma recompensa.

    O DL e o RL não são mutuamente excludentes. Na verdade, você pode usar o Deep Learning em um sistema de Reinforcement Learning, o que é chamado de Deep Reinforcement Learning (aprendizado por reforço profundo)

O que é Deep Learning?

Deep Learning é essencialmente um sistema autônomo de auto-aprendizagem no qual você usa informações existentes para treinar algoritmos e encontrar padrões. Os resultados obtidos são usados como previsões sobre novos dados.

Por exemplo, é possível treinar um algoritmo de DL para reconhecer gatos em uma fotografia, apenas ao alimentar milhões de imagens com e sem gatos. O programa então estabelecerá padrões de classificação e agrupamento dos dados da foto (arestas, formatos, cores, distâncias entre as formas etc.). O modelo criado com base nos dados de treinamento passa a funcionar de forma preditiva, capaz de examinar novos conjuntos de arquivos e prever se elas contêm gatos ou não.

Algoritmos de DL fazem isso por meio de várias camadas de redes neurais artificiais, que imitam a ligação de neurônios em nosso cérebro. Isso permite a execução de vários ciclos para diminuir os padrões e melhorar as previsões a cada nova tentativa.

Um ótimo exemplo de DL na prática é o Face ID da Apple. Ao configurar seu telefone, você treina o algoritmo com a varredura do seu rosto. A cada logon, a câmera TrueDepth captura milhares de pontos de dados que criam um mapa de profundidade da face. Na sequência, o mecanismo neural embutido no telefone executa a análise para prever se é o dono do smartphone ou não.

Copyright Forbes Brasil. Todos os direitos reservados. É proibida a reprodução, total ou parcial, do conteúdo desta página em qualquer meio de comunicação, impresso ou digital, sem prévia autorização, por escrito, da Forbes Brasil (copyright@forbes.com.br).