Álvaro Matias: Previsão

sábado, 11 de maio de 2019

Previsão

Ajay Agrawal, Joshua Gans e Avi Goldfarb, no livro “Máquinas de previsão: a economia simples da inteligência artificial”, afirmam a previsão ser o processo de preenchimento de informações ausentes. A previsão usa as informações já de sua posse, geralmente chamadas de “dados”, e as usa para gerar informações não possuídas.

Além de gerar informações sobre o futuro, a previsão pode gerar informações sobre o presente e o passado. Isso acontece quando a previsão classifica as transações com cartão de crédito como fraudulentas, um tumor em uma imagem como maligno ou se uma pessoa segurando um iPhone é o proprietário.

O impacto de pequenas melhorias na precisão da previsão pode ser enganoso. Por exemplo, uma melhoria de 85% para 90% de precisão parece mais de duas vezes maior do que de 98% para 99,9% (um aumento de 5 pontos percentuais em comparação com 2). No entanto, a melhoria anterior significa os erros caírem em um terço, enquanto o segundo significa os erros caírem por um fator de vinte. Em alguns cenários, erros ao caírem por um fator de vinte são transformacionais.

O processo aparentemente mundano de preencher informações perdidas pode fazer as máquinas de previsão parecerem mágicas. Isso já aconteceu quando as máquinas viram (reconhecimento de objetos), navegaram (carros sem motoristas) e traduziram (tradução automática via aplicativos instalados em smartphones).

A ciência de aprendizado de máquina tinha objetivos diferentes das estatísticas. Enquanto as estatísticas enfatizavam estarem corretas, em média, o aprendizado de máquina não exigia isso. Em vez disso, o objetivo era a eficácia operacional.

As previsões poderiam ter preconceitos ou vieses, se fossem melhores comparativamente (algo possível com computadores poderosos). Isso deu aos cientistas a liberdade de experimentar e conduzir melhorias rápidas. Eles aproveitam a maior disponibilidade dos grandes dados [big data] e os computadores rápidos surgidos na última década.

Os métodos estatísticos tradicionais requerem a articulação de hipóteses ou pelo menos da intuição humana para a especificação do modelo. O aprendizado de máquina tem menos necessidade de especificar antecipadamente o que entra no modelo e pode acomodar o equivalente a modelos muito mais complexos, com muito mais interações entre variáveis.

Avanços recentes no aprendizado de máquina são frequentemente referidos como avanços na inteligência artificial porque:

(1) os sistemas baseados nessa técnica aprendem e melhoram com o tempo;

(2) esses sistemas produzem previsões significativamente mais precisas do que outras abordagens sob certas condições, e alguns especialistas argumentam a previsão ser central para a inteligência; e

(3) a maior precisão de previsão desses sistemas permite eles realizarem tarefas, como tradução e navegação, antes consideradas domínio exclusivo da inteligência humana.

Os coautores permanecem agnósticos na ligação entre previsão e inteligência. Nenhuma de suas conclusões se baseia em tomar uma posição sobre se os avanços na previsão representam avanços na inteligência. Eles se concentram nas consequências de uma queda no custo da previsão, não em uma queda no custo da inteligência.

As máquinas de previsão utilizam três tipos de dados:

(1) dados de treinamento para treinar o AI,

(2) dados de entrada para previsão e

(3) dados de feedback para melhorar a precisão da previsão.

A coleta de dados é cara; é um investimento. O custo da coleta de dados depende de quantos dados você precisa e de quão intrusivo é o processo de coleta. É essencial equilibrar o custo da aquisição de dados com o benefício de uma maior precisão de previsão. Determinar a melhor abordagem requer estimar o ROI de cada tipo de dados: quanto custará adquirir e qual será o valor do aumento na precisão da previsão?

Razões estatísticas e econômicas determinam se ter mais dados gerará mais valor.

Do ponto de vista estatístico, os dados têm retornos decrescentes. Cada unidade adicional de dados melhora sua previsão menos em relação aos dados anteriores; a décima observação melhora a previsão em mais de um milésimo.

Em termos de economia, o relacionamento é ambíguo. Adicionar mais dados a um grande estoque existente de dados pode ter custo maior em lugar de adicioná-lo a um pequeno estoque.

Por exemplo, se os dados adicionais permitirem o desempenho da máquina de previsão cruzar um limite de inutilizável para utilizável ou abaixo de um desempenho normativo limiar para acima, ou de pior em comparação a um concorrente para melhor. Assim, as organizações precisam entender a relação entre:

adicionar mais dados,
aumentar a precisão da previsão e
aumentar a criação de valor.

Humanos, incluindo especialistas profissionais, fazem previsões ruins sob certas condições. Os seres humanos geralmente apresentam um excesso de informações importantes e os analistas não são responsáveis ao observar as propriedades estatísticas essenciais. Muitos estudos científicos documentam essas deficiências em uma ampla variedade de profissões. O fenômeno foi ilustrado no filme Moneyball.

Máquinas e seres humanos têm pontos fortes e fracos distintos no contexto da previsão. À medida que as máquinas de previsão melhoram, as empresas precisam ajustar sua divisão de trabalho entre humanos e máquinas em resposta. As máquinas de previsão são melhores comparadas aos seres humanos ao fatorar interações complexas entre diferentes indicadores, especialmente em ambientes com grandes dados [big data].

À medida que o número de dimensões para essas interações cresce, a capacidade dos humanos de formar predições precisas diminui, especialmente em relação às máquinas. No entanto, os humanos geralmente são melhores comparados às máquinas quanto a entender o processo de geração de dados conferir uma vantagem de previsão, especialmente em configurações com dados finos ou particulares.

Os coautores descrevem uma taxonomia de configurações de previsão, ou seja, “conhecidos conhecidos”, “desconhecidos conhecidos”, “desconhecidos conhecidos” e “desconhecidos desconhecidos”. Ela é útil para antecipar a divisão apropriada do trabalho de geração.

Escala de máquinas de previsão: o custo unitário por previsão diminui à medida que a frequência aumenta. A previsão humana não escala da mesma maneira. No entanto, os seres humanos têm modelos cognitivos de como o mundo funciona e, portanto, pode fazer previsões baseadas em pequenas quantidades de dados.

Assim, os coautores deste livro preveem um aumento na predição humana por exceção, enquanto as máquinas gerarão a maioria das previsões, porque são baseadas em dados rotineiros e regulares. Mas quando ocorrem eventos raros, a máquina reconhece não ser capaz de produzir uma previsão com confiança e, portanto, solicita assistência humana. O humano fornece a previsão por exceção.

Previsão publicado primeiro em https://fernandonogueiracosta.wordpress.com

Álvaro Matias

sábado, 11 de maio de 2019

Previsão

Nenhum comentário:

Postar um comentário