Skip to content

Projecoes das eleicoes de 2022 usando dados disponibilizados pelo Jornal Nexo.

Notifications You must be signed in to change notification settings

lsbastos/projecoes_2022

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Projecoes para as eleições 2022

Projeções para o resultado das eleições de 2022 para prsidente da republica usando resultados de pesquisas eleitorais disponibilizados no GitHub do Jornal Nexo. A ideia dessa modelagem surgiu a partir de um Tweet do Gabriel Lorenssi e do meu interesse em acompanhar das pesquisas agregado os resultados e prevendo até o dia da eleição.

Vou considerar apenas os institutos considerados neutros segundo o site Poolidata que se baseia na avaliação do governo. Institutos que se distanciam demais da média dos demais institutos sao cnsiderads favoráveis ou desfavoráveis ao governo. Usei apenas os classificados como neutros (Ipec, Datafolha, Real Time Big Data, Sensus, FSB, Quaest e Ideia Big Data).

Resultados

Densidade da proporção de votos válidos para cada candidato no dia da eleição

Violin plot dos votos válidos para cada candidato no dia da eleição

Estimativas para o dia da eleição

# A tibble: 5 × 5
  Candidato   Prop     LI     LS Prob_vitoria_1o_turno
  <ord>      <dbl>  <dbl>  <dbl>                 <dbl>
1 Lula      0.485  0.464  0.503                  0.052
2 Bolsonaro 0.380  0.364  0.399                  0    
3 Ciro      0.0614 0.0540 0.0702                 0    
4 Tebet     0.0540 0.0429 0.0667                 0    
5 Outros    0.0187 0.0138 0.0254                 0         

Projeções para a proporção de votos em cada candidato até o dia da eleição do primeiro turno.

Descrição do método

O modelo proposto utiliza as estimativas para a proporção de votos de cada candidato como desfecho ou variável resposta, e prevê para cada candidato como serão os próximos dias até a data da eleição.

O modelo estatístico escolhido foi um modelo dinâmico de crescimento linear considerando dados diários e uma transformação logística para as proporções. Seja $P_{k,t}$ a proporção de votos para o candidato $k$ no dia $t$ do insttuto $i$. $$Y_{k,t,i} = \log\left(\frac{P_{k,t,i}}{1-P_{k,t,i}}\right) \sim Normal( \mu_{k,t,i}, \sigma_k^2)$$ onde $\forall k$ assumimos que a méda de $Y_{k,t,i}$ assume um valor médio para cada candidato, e comum no tempo e entre institutos, adicionado por dois efeitos aleatórios. Um não estruturado para capturar a heterogenedade cada instituto, e outro, agora estrutura, para descrever e incluir a dependência temporal entre estimativas. $$\mu_{k,t,i} = \mu_k + \alpha_{k,t} + \beta_{k,i},$$ $$\mu_{k} \sim N(0, V \to \infty),$$ $$\alpha_{k,t} \sim AR(2, \tau^2_\alpha), \quad , \quad \tau_\alpha^2&gt;0,$$ $$\beta_{k,i} \sim Normal(0, \tau^2_\beta), \quad \tau_\beta^2&gt;0, $$

O modelo se completa com distribuições a priori para os parâmetros. Foram utilizadas prioris vagas, isto é, pouco informativas e default do pacote INLA (https://www.r-inla.org/).

Uma vez estimados os parâmetros, a distribuição preditiva é acessada gerando estimativas para todos os dias desde o primeiro dia que se tem alguma pesquisa até o dia da eleição. Para dias anteriores ao dia da última pesquisa disponível no banco temos as estimativas ajustadas, e entre o último dia com algum resultado de pesquisa eleitoral até a data da eleição temos as projeções diárias de cada candidato sob esse modelo.

Os candidatos considerados foram Lula, Bolsonaro, Ciro, e Tebet. Os demais candidatos foram agrupados em Outros, e brancos nulos e indecisos foram chamados de BNI. Outros e BNI foram tratados como se fossem candidatos independentes.

Calculando a projeção de votos no dia da eleição

As projeções das estimativas de cada candidato foram geradas, e para o dia da eleição amostras da distribuição preditiva a proporção de votos de cada candidato foi gerada, e a proporção de votos válidos foi calculada removendo os brancos, nulos e indecisos e recalculando os totais.

Com a amostra da distribuição preditiva da proporção de votos, podemos calcular a probabilidade de vitória já no primeiro turno para cada candidato. Essa etapa é feita usando integração de Monte Carlo.

Os códigos estão disponíveis aqui.

Limitações

Existem muitas limitações, algumas delas:

  • O modelo não considera a abstenção que nas últimas eleições ficou acima de 20%.
  • Não assume nenhuma mudança de cenário, apenas acompanha a tendência de crescimento (linear) mais recente.
  • Uso de modelos gaussianos em transformações dos dados poderia ser aprimorado usando por exemplo a distribuição Dirichet. Isso é importante pois como no formato atual cada candidato é tratado separadamente, teoricamente é possível que a soma das proporções passe de 100%. No passo de Monte Carlo isso é corrigido ao remover a categoria BNI e recalcular as proporções.
  • Todos institutos de pesquisas tiveram o mesmo peso.
  • Certamente existem outras, postarei aqui se lembrar de outra.

About

Projecoes das eleicoes de 2022 usando dados disponibilizados pelo Jornal Nexo.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages