Pular para o conteúdo
início » Os benefícios de utilizar fatores economicamente significativos na Ciência de Dados Financeiros.

Os benefícios de utilizar fatores economicamente significativos na Ciência de Dados Financeiros.

    Seleção de fatores é uma das nossas considerações mais importantes ao construir modelos financeiros. Então, à medida que a aprendizagem de máquina (AM) e a ciência de dados se tornam cada vez mais integradas às finanças, quais fatores devemos selecionar para nossos modelos de investimento impulsionados por AM e como devemos selecioná-los?

    Essas são questões abertas e críticas. Afinal, modelos de AM podem ajudar não apenas no processamento de fatores, mas também na descoberta e criação de fatores.

    Fatores em modelos estatísticos tradicionais e de AM: Os (muito) básicos

    A seleção de fatores em aprendizagem de máquina é chamada de “seleção de recursos”. Fatores e recursos ajudam a explicar o comportamento de uma variável alvo, enquanto modelos de fatores de investimento descrevem os principais impulsionadores do comportamento de uma carteira.

    Talvez o método de construção de modelos de fatores mais simples seja a regressão de mínimos quadrados (MLE), em que o retorno da carteira é a variável dependente e os fatores de risco são as variáveis independentes. Desde que as variáveis independentes tenham correlação suficientemente baixa, diferentes modelos serão estatisticamente válidos e explicarão o comportamento da carteira em diferentes graus, revelando qual porcentagem do comportamento da carteira é responsabilidade do modelo em questão, bem como a sensibilidade do retorno da carteira ao comportamento de cada fator, conforme expresso pelo coeficiente beta anexado a cada fator.

    Da mesma forma que seus homólogos estatísticos tradicionais, os modelos de regressão de AM também descrevem a sensibilidade de uma variável em relação a uma ou mais variáveis explicativas. No entanto, os modelos de AM frequentemente conseguem ter em conta comportamentos não lineares e efeitos de interação melhor do que seus pares não-AM, e geralmente não fornecem análogos diretos da regressão de MLE, como coeficientes beta.

    Por que os fatores devem ter significado econômico

    Embora fatores sintéticos sejam populares, fatores economicamente intuitivos e empiricamente validados têm vantagens sobre fatores “estatísticos”, exceto casos especiais, como negociação de alta frequência (HFT). A maioria dos pesquisadores prefere um modelo o mais simples possível. Portanto, muitas vezes começamos com uma regressão de mínimos quadrados ou algo semelhante, obtemos resultados convincentes e, talvez, passamos para um modelo de AM mais sofisticado.

    Mas, em regressões tradicionais, os fatores devem ser suficientemente distintos, ou não altamente correlacionados, para evitar o problema da multicolinearidade, que pode desqualificar uma regressão tradicional. A multicolinearidade implica que um ou mais fatores explicativos de um modelo são muito similares para fornecer resultados compreensíveis. Portanto, em uma regressão tradicional, menor correlação entre fatores – evitando a multicolinearidade – significa que os fatores provavelmente são economicamente distintos.

    No entanto, a multicolinearidade muitas vezes não se aplica na construção de modelos de AM da mesma forma que na regressão de MLE. Isso ocorre porque, ao contrário dos modelos de regressão de MLE, as estimativas dos modelos de AM não requerem a inversão de uma matriz de covariância. Além disso, os modelos de AM não possuem suposições paramétricas estritas ou dependência da homoscedasticidade – independência dos erros – ou outras suposições de séries temporais.

    No entanto, embora os modelos de AM sejam relativamente livres de regras, pode ser necessário um trabalho prévio considerável para garantir que as entradas de um determinado modelo tenham relevância de investimento e coerência econômica e sejam únicas o suficiente para produzir resultados práticos sem redundâncias explicativas.

    Embora a seleção de fatores seja essencial para qualquer modelo de fatores, ela é especialmente crítica ao usar métodos baseados em AM. Uma maneira de selecionar fatores distintos, mas economicamente intuitivos, na etapa pré-modelo, é usar a técnica do operador de redução e seleção absoluta mínima (LASSO). Isso dá aos construtores de modelos a capacidade de destilar um grande conjunto de fatores em um conjunto menor, fornecendo considerável poder de explicação e independência máxima entre os fatores.

    Outra razão fundamental para usar fatores economicamente significativos: eles têm décadas de pesquisa e validação empírica para respaldá-los. A utilidade dos fatores Fama-French-Carhart, por exemplo, é bem documentada, e pesquisadores os estudaram em regressões de MLE e outros modelos. Portanto, sua aplicação em modelos impulsionados por AM é intuitiva. Na verdade, em talvez o primeiro artigo de pesquisa a aplicar AM a fatores de ações, Chenwei Wu, Daniel Itano, Vyshaal Narayana e eu demonstramos que os fatores Fama-French-Carhart, em conjunto com duas estruturas de AM bem conhecidas – florestas aleatórias e aprendizado de regras de associação – podem realmente ajudar a explicar retornos de ativos e criar modelos comerciais de investimento bem-sucedidos.

    Finalmente, ao implantar fatores economicamente significativos, podemos entender melhor alguns tipos de resultados de AM. Por exemplo, florestas aleatórias e outros modelos de AM fornecem valores de importância de recursos relativos. Essas pontuações e classificações descrevem o quanto cada fator fornece poder de explicação em relação aos outros fatores em um modelo. Esses valores são mais fáceis de entender quando os relacionamentos econômicos entre os vários fatores do modelo são claramente delineados.

    Conclusão

    Grande parte do apelo dos modelos de AM se baseia em sua natureza relativamente livre de regras e em como eles acomodam bem diferentes inputs e heurísticas. No entanto, algumas regras devem guiar como aplicamos esses modelos. Ao depender de fatores economicamente significativos, podemos tornar nossos frameworks de investimento impulsionados por AM mais compreensíveis e garantir que apenas os modelos mais completos e instrutivos informem nosso processo de investimento.