Pular para o conteúdo
início » Traduza para o idioma português do brasil Machine Learning Algorithms and Training Methods: A Decision-Making Flowchart

Traduza para o idioma português do brasil Machine Learning Algorithms and Training Methods: A Decision-Making Flowchart

    A aprendizagem de máquina está pronta para transformar a gestão de investimentos. No entanto, muitos profissionais de investimento ainda estão desenvolvendo seu entendimento sobre como a aprendizagem de máquina funciona e como aplicá-la. Com isso em mente, a seguir está uma introdução aos métodos de treinamento de aprendizagem de máquina e um fluxograma de tomada de decisões de aprendizagem de máquina com notas explicativas que podem ajudar a determinar qual abordagem aplicar com base no objetivo final.

    Métodos de Treinamento de Aprendizagem de Máquina

    1. Aprendizado em Conjunto

    Não importa o quão cuidadosamente selecionado, cada algoritmo de aprendizagem de máquina terá uma determinada taxa de erro e estará propenso a previsões incorretas. O aprendizado em conjunto aborda essas falhas combinando previsões de vários algoritmos e média dos resultados. Isso reduz o ruído e produz previsões mais precisas e estáveis do que o melhor modelo único. De fato, soluções de aprendizado em conjunto venceram muitas competições de aprendizagem de máquina prestigiosas ao longo dos anos.

    O aprendizado em conjunto pode agregar aprendizes heterogêneos ou homogêneos. Os aprendizes heterogêneos são diferentes tipos de algoritmos combinados com um classificador de votação. Já os aprendizes homogêneos são combinações do mesmo algoritmo que usam dados de treinamento diferentes com base na técnica de agregação de bootstrap, ou bagging.

    2. Aprendizado por Reforço

    Conforme as aplicações de realidade virtual começam a se assemelhar a ambientes do mundo real, abordagens de aprendizado de máquina por tentativa e erro podem ser aplicadas aos mercados financeiros. Algoritmos de aprendizado por reforço extraem insights interagindo entre si e com os dados gerados pelo mesmo algoritmo. Eles também utilizam redes neurais profundas (DNNs) supervisionadas ou não supervisionadas no aprendizado profundo (DL).

    O aprendizado por reforço ganhou destaque quando o programa AlphaGo, da DeepMind, derrotou o campeão mundial do jogo antigo Go em 2017. O algoritmo AlphaGo apresenta um agente projetado para executar ações que maximizam recompensas ao longo do tempo, levando em consideração as restrições do ambiente.

    O aprendizado por reforço com aprendizado não supervisionado não possui dados rotulados diretamente para cada observação ou feedback instantâneo. Em vez disso, o algoritmo deve observar seu ambiente, aprender testando novas ações – algumas das quais podem não ser imediatamente ótimas – e reaplicar suas experiências anteriores. O aprendizado ocorre por tentativa e erro.

    Acadêmicos e profissionais estão aplicando o aprendizado por reforço em estratégias de investimento: o agente pode ser um negociador virtual que segue certas regras de negociação (ações) em um mercado específico (ambiente) para maximizar seus lucros (recompensas). No entanto, se o aprendizado por reforço pode navegar pelas complexidades dos mercados financeiros ainda é uma questão em aberto.

    Fluxograma de Tomada de Decisões de Aprendizagem de Máquina

    Notas de rodapé

    1. A análise de componentes principais (PCA) é um indicador da complexidade do modelo de previsão e ajuda a reduzir o número de features ou dimensões. Se os dados tiverem muitas features Xi altamente correlacionadas, então um PCA pode realizar uma mudança de base nos dados para selecionar apenas os componentes principais com maior poder explicativo em relação à variância das features. Um conjunto de vetores linearmente independentes e ortogonais – em que n é um número natural ou não-negativo – é chamado de base. Inputs são features na aprendizagem de máquina, enquanto inputs são chamados de variáveis explicativas ou independentes na regressão linear e outros métodos estatísticos tradicionais. Da mesma forma, um target Y (saída) na aprendizagem de máquina é uma variável dependente nas metodologias estatísticas.

    2. Processamento de linguagem natural (PLN) inclui, mas não se limita, à análise de sentimentos de dados textuais. Geralmente, ele possui várias etapas de aprendizado supervisionado e não supervisionado e geralmente é considerado auto-supervisionado, pois tem propriedades tanto supervisionadas quanto não supervisionadas.

    3. A regressão linear simples ou múltipla sem regularização (penalização) é geralmente categorizada como uma técnica estatística tradicional, mas não um método de aprendizagem de máquina.

    4. A regressão Lasso, ou regularização L1, e a regressão ridge, ou regularização L2, são técnicas de regularização que evitam o overfitting com a ajuda de penalização. Simplificando, o Lasso é usado para reduzir o número de features, ou seleção de features, enquanto o ridge mantém o número de features. O Lasso tende a simplificar o modelo de previsão de destino, enquanto o ridge pode ser mais complexo e lidar com multicolinearidade entre features. Ambas as técnicas de regularização podem ser aplicadas não apenas com métodos estatísticos, incluindo regressão linear, mas também na aprendizagem de máquina, como o aprendizado profundo, para lidar com relacionamentos não lineares entre alvos e features.

    5. Aplicações de aprendizagem de máquina que empregam uma rede neural profunda (DNN) são frequentemente chamadas de aprendizado profundo. Os valores-alvo são dados numéricos contínuos. O aprendizado profundo possui hiperparâmetros (por exemplo, número de épocas e taxa de aprendizado de regularização), que são fornecidos e otimizados por humanos, não por algoritmos de aprendizado profundo.

    6. Árvores de classificação e regressão (CARTs) e florestas aleatórias têm valores-alvo que são dados discretos ou categóricos.

    7. O número do cluster K – um dos hiperparâmetros – é uma entrada fornecida por um humano.

    8. O agrupamento hierárquico é um algoritmo que agrupa dados de entrada similares em clusters. O número de clusters é determinado pelo algoritmo, não por entrada humana direta.

    9. O algoritmo K-vizinhos mais próximos (KNN) também pode ser usado para regressão. O algoritmo KNN precisa de um número de vizinhos (classificações) fornecido por um humano como um hiperparâmetro. O algoritmo KNN também pode ser usado para regressão, mas foi omitido por simplicidade.

    10. Máquinas de vetores de suporte (SVMs) são conjuntos de métodos de aprendizado supervisionado aplicados à classificação linear, mas que também usam classificação e regressão não lineares.

    11. Classificadores Bayes ingênuos são probabilísticos e aplicam o teorema de Bayes com suposições fortes (ingênuas) de independência entre as features.

    Referências

    Kathleen DeRose, CFA, Matthew Dixon, PhD, FRM e Christophe Le Lannou. 2021. “Machine Learning.” CFA Institute Refresher Reading. Programa CFA de 2022, Nível II, Leitura 4.

    Robert Kissell, PhD, e Barbara J. Mack. 2019. “Fintech em Gestão de Investimentos.” CFA Institute Refresher Reading, Programa CFA de 2022, Nível I, Leitura 55.

    Se você gostou deste post, não se esqueça de se inscrever no Enterprising Investor.

    Todas as postagens são opiniões do autor. Como tal, elas não devem ser interpretadas como conselhos de investimento, nem as opiniões expressas necessariamente refletem as opiniões do CFA Institute ou do empregador do autor.

    Crédito da imagem: ©Getty Images/Jorg Greuel

    Aprendizado profissional para membros do CFA Institute

    Os membros do CFA Institute têm autonomia para determinar e relatar créditos de aprendizado profissional (PL) adquiridos, incluindo conteúdo do Enterprising Investor. Os membros podem registrar créditos facilmente usando seu rastreador online de PL.