MODELAGEM E PREVISÃO DE PEQUENAS SÉRIES TEMPORAIS DE DENSIDADE DE MICROEMPRESAS
Pequenas Séries Temporais. Modelagem Individual. Modelagem pooled. Aprendizado de Máquina online. Desenvolvimento Regional. Densidade de Microempresas.
Estudos sobre a modelagem de pequenas séries temporais ganham crescente relevância, sobretudo em contextos territoriais e econômicos com dados escassos, heterogeneidade estrutural e forte dispersão espacial. Por isso, este trabalho investiga estratégias de previsão para séries temporais curtas de densidade de microempresas em condados dos Estados Unidos, utilizando 100 séries mensais com 39 observações cada, onde compara abordagens de modelagem individual e empilhada (pooled), utilizando diferentes paradigmas de aprendizado de máquina e oito formalismos: Modelo Autorregressivo Integrado de Médias Móveis (ARIMA), Erro, Tendência e Sazonalidade (ETS), Regressão por Vetores de Suporte (SVR), Árvore de Decisão Regressora (DT), Floresta Aleatória (RF), Impulsionamento de Gradiente Extremo (XGB), Perceptron Multicamadas (MLP) e Memória de Longo e Curto Prazo (LSTM). A principal contribuição metodológica é a adaptação dos modelos ARIMA e ETS para atualização online ponto a ponto (h = 1), com reestimativa sequencial, simulando previsão em tempo real – uma abordagem pouco explorada em séries curtas. Os demais modelos foram estruturados em arquiteturas univariados e multivariados com defasagens (lags), incorporando padronização e codificação de variáveis categóricas. A avaliação preditiva utilizou o Erro Percentual Absoluto Médio (MAPE) e testes estatísticos formais de comparação (Diebold- Mariano, teste Z e binomiais). Os resultados mostraram clara superioridade da abordagem individual que apresentou menores erros médios, maior estabilidade e predominância estatística, com MAPE médio de 4,36% e mínimo de 0,37%, com destaque para os modelos online ARIMA e ETS. Na abordagem pooled, os modelos registraram MAPE médio de 8,73% e mínimo de 0,53%, onde o XGB obteve os melhores resultados, com proporção significativamente superior de vitórias em testes estatísticos, sugerindo potencial para capturar padrões compartilhados em séries curtas. Já os modelos LSTM e MLP demonstraram sensibilidade à variabilidade das séries e não obtiveram vitórias significativas nesta abordagem. Os achados reforçam que a escolha entre abordagens individual e pooled deve ser guiada pelas características do conjunto de dados, pelo tipo de modelo utilizado e pelo grau de heterogeneidade entre as séries.