Objetivo: estimar novos casos de sífilis adquirida no Brasil, utilizando os modelos Autorregressivo Integrado de Médias Móveis Sazonal (SARIMA), de Memória em Curto-Longo Prazo (LSTM) e a média aritmética entre eles. Métodos: foram analisados dados do Sistema de Informação de Agravos de Notificação referentes às notificações mensais entre 2014 e 2023. A validação utilizou o Erro Percentual Absoluto Médio (MAPE), a Raiz do Erro Quadrático Médio (RMSE) e o Erro Absoluto Médio (MAE). Resultados: a série apresentou tendência crescente e sazonalidade anual. Foi não estacionária (ADF p = 0,659) e exibiu autocorrelação (Ljung-Box p < 0,001). O modelo SARIMA (0,1,2)(0,0,1)[12] e LSTM foram comparados. Ambos apresentaram resíduos aleatórios (Ljung-Box: SARIMA p = 0,068; LSTM p = 0,321). As métricas foram próximas, com leve vantagem do SARIMA (RMSE 2.232 vs 2.422; MAE 1.891 vs 1.922; MAPE 10%). A média aritmética obteve melhores resultados em todos os índices de erro e independência do ruído. As previsões do SARIMA estabilizam em 19,8 mil casos a partir de março de 2025, enquanto as do LSTM declinam até 18,96 mil no mesmo período. Observaram-se tendência de aumento em todos os recortes populacionais e só existiu presença de autocorrelação dos dados no recorte de região, indicando necessidade de ver o todo para compreensão das partes. Conclusões: ambos os modelos foram adequados para estimar casos de sífilis adquirida, sem diferença marcante de precisão, com a média aritmética aumentando ainda mais a confiabilidade das previsões.
Objective: to estimate new cases of acquired syphilis in Brazil using the Autoregressive Integrated Moving Average (SARIMA) model, the Long-Short-Term Memory (LSTM) model, and the arithmetic mean between them. Methods: data from the Notifiable Diseases Information System regarding monthly notifications between 2014 and 2023 were analyzed. Validation used the Mean Absolute Percentage Error (MAPE), the Root Mean Square Error (RMSE), and the Mean Absolute Error (MAE). Results: The series showed an increasing trend and annual seasonality. It was non-stationary (ADF p = 0.659) and exhibited autocorrelation (Ljung-Box p < 0.001). The SARIMA (0,1,2)(0,0,1)[12] and LSTM models were compared. Both models presented random residuals (Ljung-Box: SARIMA p = 0.068; LSTM p = 0.321). The metrics were close, with a slight advantage for SARIMA (RMSE 2.232 vs 2.422; MAE 1.891 vs 1.922; MAPE 10%). The arithmetic mean obtained better results in all error indices and independence from noise. SARIMA predictions stabilize at 19,800 cases from March 2025 onwards, while LSTM predictions decline to 18,960 in the same period. An increasing trend was observed in all population segments, and autocorrelation of the data was only present in the regional segment, indicating the need to consider the whole to understand the parts. Conclusions: both models were adequate for estimating cases of acquired syphilis, with no significant difference in accuracy, and with the arithmetic mean further increased the reliability of the predictions.