Resumo
Modelos de aprendizado de máquina vem sendo utilizados cada vez mais em todas as áreas do conhecimento como consequência da notória capacidade preditiva desses métodos, aliada ao crescente desenvolvimento dos processadores e à imensa disponibilidade de dados. Nesse contexto, o objetivo deste projeto é avaliar o desempenho dos modelos mais comuns de aprendizado de máquina aplicados em um problema de previsão de retornos financeiros a partir de dezenas de variáveis explanatórias. Para tal, foram ajustados o modelos de Gradient boosted regression trees, florestas aleatórias e redes neurais com base em dados reais de ativos financeiros de mais de 30 anos de diferentes mercados dos Estados Unidos. Os resultados obtidos, no entanto, mostram que os métodos de aprendizado de máquina não melhoram significativamente as previsões obtidas através da média histórica e não foram identificadas variáveis relevantes.
Referências
Efron B, Hastie T. Computer age statistical inference. Cambridge
University Press; 2016.
Fama E, French KR. Dissecting anomalies. The Journal of Finance. 2008
Jul;63(4):1653–1678.
Green J, Hand JR, Zhang XF. The characteristics that provide independent
information about average us monthly stock returns. The Review of Financial
Studies. 2017 Feb;30(12):4389–4436.
Green J, Hand JR, Zhang XF. The supraview of return predictive signals.
Review of Accounting Studies. 2013 Dec;18(3):692–730.
Gu S, Kelly B, Xiu D. Empirical asset pricing via machine learning.
National Bureau of Economic Research; 2018.
Koijen RSJ, Van Nieuwerburgh S. Predictability of returns and cash flows.
Annual Review of Financial Economics. 2011 Jan;3(1):467–491.
Todos os trabalhos são de acesso livre, sendo que a detenção dos direitos concedidos aos trabalhos são de propriedade da Revista dos Trabalhos de Iniciação Científica da UNICAMP.