Pular para o conteúdo
início » Aprendizado de máquina e Declarações do FOMC: Qual é o Sentimento?

Aprendizado de máquina e Declarações do FOMC: Qual é o Sentimento?

    O Federal Reserve dos EUA começou a aumentar a taxa de juros federais em março de 2022. Desde então, quase todas as classes de ativos tiveram um desempenho ruim, enquanto a correlação entre ativos de renda fixa e ações disparou, tornando a renda fixa ineficaz em seu papel tradicional como uma ferramenta de proteção.

    Com o valor da diversificação de ativos diminuído, pelo menos temporariamente, alcançar uma compreensão objetiva e quantificável das perspectivas do Federal Open Market Committee (FOMC) tornou-se cada vez mais crítico.

    É aí que entra o aprendizado de máquina (ML) e o processamento de linguagem natural (NLP). Aplicamos listas de palavras de sentimento Loughran-McDonald e técnicas de ML BERT e XLNet para NLP em declarações do FOMC para ver se eles anteciparam mudanças na taxa de juros federais e, em seguida, examinamos se nossos resultados tiveram alguma correlação com o desempenho do mercado de ações.

    Listas de Palavras de Sentimento Loughran-McDonald

    Antes de calcular as pontuações de sentimento, construímos nuvens de palavras para visualizar a frequência/importância de palavras específicas nas declarações do FOMC.

    Nuvem de Palavras: Declaração do FOMC de março de 2017

    Nuvem de Palavras: Declaração do FOMC de julho de 2019

    Embora o Fed tenha aumentado a taxa de juros federais em março de 2017 e a diminuído em julho de 2019, as nuvens de palavras das duas declarações correspondentes parecem semelhantes. Isso ocorre porque as declarações do FOMC geralmente contêm muitas palavras sem sentimento com pouca relação com as perspectivas do FOMC. Assim, as nuvens de palavras não conseguiram distinguir o sinal do ruído. Mas análises quantitativas podem oferecer alguma clareza.

    As listas de palavras de sentimento Loughran-McDonald analisam documentos 10-K, transcrições de chamadas de resultados e outros textos, classificando as palavras nas seguintes categorias: negativas, positivas, incertas, litigiosas, modais fortes, modais fracos e restritivas. Aplicamos essa técnica às declarações do FOMC, designando palavras como positivas/altistas ou negativas/baixistas, filtrando textos menos importantes como datas, números de página, membros votantes e explicações da implementação da política monetária. Em seguida, calculamos as pontuações de sentimento usando a seguinte fórmula:

    Pontuação de Sentimento = (Palavras Positivas – Palavras Negativas) / (Palavras Positivas + Palavras Negativas)

    Como o gráfico anterior demonstra, as declarações do FOMC se tornaram mais positivas/altistas em março de 2021 e atingiram o topo em julho de 2021. Após suavizar nos 12 meses seguintes, o sentimento disparou novamente em julho de 2022. Embora esses movimentos possam ser impulsionados em parte pela recuperação da pandemia de COVID-19, eles também refletem uma maior postura altista do FOMC diante da crescente inflação nos últimos anos.

    Mas as grandes flutuações também indicam uma deficiência inerente na análise de Loughran-McDonald: as pontuações de sentimento avaliam apenas palavras, não frases. Por exemplo, na frase “O desemprego diminuiu”, ambas as palavras seriam categorizadas como negativas/baixistas, mesmo que, como frase, a declaração indique um mercado de trabalho em melhora, o que a maioria interpretaria como positivo/altista.

    Para abordar essa questão, treinamos os modelos BERT e XLNet para analisar as declarações em uma base de frase por frase.

    BERT e XLNet

    Bidirectional Encoder Representations from Transformers, ou BERT, é um modelo de representação de linguagem que usa um codificador bidirecional em vez de unidirecional para um melhor ajuste fino. De fato, com seu codificador bidirecional, descobrimos que o BERT tem um desempenho melhor do que o OpenAI GPT, que usa um codificador unidirecional.

    XLNet, por outro lado, é um método de pré-treinamento generalizado autoregressivo que também apresenta um codificador bidirecional, mas não modelagem de linguagem mascarada (MLM), que alimenta o BERT com uma sentença e otimiza os pesos dentro do BERT para produzir a mesma sentença do outro lado. Antes de alimentarmos o BERT com a sentença de entrada, no entanto, mascaramos alguns tokens no MLM. O XLNet evita isso, o que torna uma versão aprimorada do BERT.

    Para treinar esses dois modelos, dividimos as declarações do FOMC em conjuntos de dados de treinamento, conjuntos de dados de teste e conjuntos de dados fora da amostra. Extraímos conjuntos de dados de treinamento e teste de fevereiro de 2017 a dezembro de 2020 e conjuntos de dados fora da amostra de junho de 2021 a julho de 2022. Em seguida, aplicamos duas técnicas de rotulagem diferentes: manual e automática. Usando a rotulagem automática, atribuímos às frases um valor de 1, 0 ou nenhum com base se indicavam um aumento, diminuição ou nenhuma mudança na taxa de juros federais, respectivamente. Usando a rotulagem manual, categorizamos as frases como 1, 0 ou nenhum, dependendo se eram altistas, baixistas ou neutras, respectivamente.

    Em seguida, executamos a seguinte fórmula para gerar uma pontuação de sentimento:

    Pontuação de Sentimento = (Frases Positivas – Frases Negativas) / (Frases Positivas + Frases Negativas)

    As duas tabelas acima demonstram que a rotulagem manual capturou melhor a mudança recente na postura do FOMC. Cada declaração inclui frases altistas (ou baixistas) mesmo que o FOMC tenha acabado por diminuir (ou aumentar) a taxa de juros federais. Nesse sentido, a rotulagem frase a frase treina bem esses modelos de ML.

    Uma vez que os modelos de ML e AI tendem a ser caixas-pretas, a forma como interpretamos seus resultados é extremamente importante. Uma abordagem é aplicar Explicações Interpretables do Modelo-Agnóstico Local (LIME). Estas aplicam um modelo simples para explicar um modelo muito mais complexo. As duas figuras abaixo mostram como o XLNet (com rotulagem manual) interpreta frases das declarações do FOMC, lendo a primeira frase como positiva/altista com base no fortalecimento do mercado de trabalho e nas atividades econômicas moderadamente crescentes, e a segunda frase como negativa/baixista, já que os preços ao consumidor caíram e a inflação ficou abaixo de 2%. O julgamento do modelo tanto sobre a atividade econômica quanto sobre a pressão inflacionária parece apropriado.

    LIME Results: FOMC Strong Economy Sentence

    LIME Results: FOMC Weak Inflationary Pressure Sentence

    Conclusão

    Ao extrair frases das declarações e avaliar seu sentimento, essas técnicas nos deram uma melhor compreensão da perspectiva de política do FOMC e têm o potencial de tornar as comunicações dos bancos centrais mais fáceis de interpretar e entender no futuro.

    Mas houve uma conexão entre as mudanças no sentimento das declarações do FOMC e os retornos do mercado de ações dos EUA? O gráfico abaixo mostra os retornos acumulados do Dow Jones Industrial Average (DJIA) e do NASDAQ Composite (IXIC) juntamente com as pontuações de sentimento do FOMC. Investigamos a correlação, erro de rastreamento,