# Importando as bibliotecas necessárias
import pandas as pd
import numpy as np
import time
import plotly.graph_objects as go
import plotly.express as px
from urllib.request import urlopen
import json
import warnings
import kaleido

import statsmodels.api as sm
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler, LabelEncoder
from sklearn.metrics import classification_report, confusion_matrix, ConfusionMatrixDisplay

warnings.filterwarnings("ignore")


# Lendo os municípios de acordo com o TSE
df_mun = pd.read_json("https://resultados.tse.jus.br/oficial/ele2022/544/config/mun-e000544-cm.json")

# Uma lista para a coluna "abr" com os dados dos municípios
dic1 = df_mun.abr.to_dict()

# Criando um novo dataframe para obter os dados passados ao dicionário anterior e criando duas colunas vazias.
df_mun = pd.DataFrame()
df_mun['ufr'] = 0.0
df_mun['uf'] = 0.0

# Loop For para a obtenção dos dados do dicionários e passar eles ao dataframe
for i in dic1:
    df_mun = pd.concat([df_mun, df_mun.from_dict(dic1[i]['mu'])], axis=0)
    df_mun.ufr.fillna(dic1[i]['cd'], inplace=True)
    df_mun.uf.fillna(dic1[i]['ds'], inplace=True)
    
df_mun.reset_index(inplace=True)
df_mun.drop('index', axis=1, inplace=True)
df_mun.drop(['c', 'z'], axis=1, inplace=True)

print("1 - Dados de Informações dos Municípios obtidos com sucesso!")

# Gerando os links do TSE para obtenção dos dados
links = "https://resultados.tse.jus.br/oficial/ele2022/544/dados/" + df_mun['ufr'].str.lower() + "/" + df_mun['ufr'].str.lower() + df_mun['cd'] + "-c0001-e000544-v.json"

print("2 - Links Obtidos com Sucessos!")
print()
print()
print("3 - Pegando os dados do site do TSE...")

# Importando os dados dos municípios no TSE
# Obs: Essas linhas levam tempo para serem executadas, pois são dados de mais de 5 mil municípios obtidos um a um.

# Criando um dataframe com os nomes das colunas e um contador para o número do municípo que estamos lendo
df_mun_of = pd.DataFrame(columns=['dt', 'ht', 'tf', 'and', 'tpabr', 'cdabr', 's', 'snt', 'si',
       'sni', 'sa', 'sna', 'pst', 'psnt', 'psi', 'psni', 'psa', 'psna',
       'ea', 'ena', 'esi', 'esni', 'c', 'a', 'pea', 'pena', 'pesi', 'pesni',
       'pa', 'pc', 'vscv', 'vnom', 'tv', 'vvc', 'vb', 'tvn', 'vn', 'vnt', 'vp',
       'vv', 'van', 'vansj', 'pvnom', 'pvvc', 'pvb', 'ptvn', 'pvn', 'pvnt',
       'pvp', 'pvv', 'pvan', 'pvansj', 'seq', 'n', 'vap', 'pvap', 'e', 'st'])

linha = 0

for i in links:
    
    print(linha, " ", end="")
    linha += 1
    
    # Puxando os dados do TSE
    new = pd.read_json(i)
    
    # Tratando os dados
    sem = pd.DataFrame(new['abr'].to_dict()[0]).drop(['cand', 'st', 'e'], axis=1)
    com = pd.DataFrame(pd.DataFrame(new['abr'].to_dict()[0])['cand'].to_dict()).transpose()
    join = pd.concat([sem, com], axis=1)
    join.reset_index(inplace=True)
    join.drop('index', axis=1, inplace=True)
    
    # Colocando em um novo dataframe
    df_mun_of = pd.concat([df_mun_of, join], axis=0)
    df_mun_of.reset_index(inplace=True)
    df_mun_of.drop('index', axis=1, inplace=True)
    
    # Esperando para não sobrecarregar o servidor do TSE
    time.sleep(0.25)

print("\n\nDados Obtidos com sucesso!")

1 - Dados de Informações dos Municípios obtidos com sucesso!
2 - Links Obtidos com Sucessos!


3 - Pegando os dados do site do TSE...
Linha 0  1  2  3  4  5  6  7  8  ... 5744  5745  5746  5747  5748  5749  5750  

Dados Obtidos com sucesso!


df_mun_of = df_mun_of[['cdabr', 'n', 'vap', 'pvap', 'st']]

df_mun_of = df_mun_of.merge(df_mun[['cd', 'uf', 'ufr', 'cdi']], left_on='cdabr', right_on='cd', how='left')

pvap = df_mun_of.pvap

df_mun_of.drop(['cdabr', 'cd', 'pvap'], axis=1, inplace=True)

porcentagem = []
for i in pvap:
    j = i.replace(',', '.')
    porcentagem.append(j)

df_mun_of['pvap'] = pd.to_numeric(porcentagem)

df_mun_of.rename(columns={
    'cd': 'uf',
    'ds': 'estado',
    'n':"num_cand",
    'vap':"vot_abs",
    'st':'eleito',
    'cdi': 'Codigo',
    'pvap': 'vot_perc'
}, inplace=True)

df_mun_of = df_mun_of.merge(pd.read_csv('dados_partidos.CSV', delimiter=';', names=['partido', 'num_cand']), left_on='num_cand',
                right_on='num_cand', how='left')

df_mun_of = df_mun_of.merge(pd.read_csv('lat_long_mun.csv', 
            usecols=[i for i in [0, 1, 2, 3]], 
            names=['Codigo', 'municipio', 'latitude', 'longitude'], 
            skiprows=1,
            dtype={
                'Codigo': np.str_
            }), left_on="Codigo", right_on="Codigo", how="left")

df_mun_of['vot_abs'] = pd.to_numeric(df_mun_of['vot_abs'])
df_mun_of['Codigo'] = pd.to_numeric(df_mun_of['Codigo'])

del j, porcentagem, pvap, df_mun

print("Limpeza concluida!")

Limpeza concluida!


dados_econ = {"distancia":"http://www.ipeadata.gov.br/ExibeSerieR.aspx?oper=exportCSVUS&serid=1574534192&DateCarto=1998&MINDATA=1998&MAXDATA=1998&TNIVID=5&TPAID=1",
"populacao": "http://www.ipeadata.gov.br/ExibeSerieR.aspx?oper=exportCSVUS&serid=1776285356&DateCarto=2021&MINDATA=2017&MAXDATA=2021&TNIVID=5&TPAID=1",
"custeio": "http://www.ipeadata.gov.br/ExibeSerieR.aspx?oper=exportCSVUS&serid=40121&tipoCarto=R&DateCarto=2020&MINDATA=2019&MAXDATA=2019&TNIVID=5&TPAID=1",
"pessoal": "http://www.ipeadata.gov.br/ExibeSerieR.aspx?oper=exportCSVUS&serid=40119&tipoCarto=R&DateCarto=2020&MINDATA=2019&MAXDATA=2019&TNIVID=5&TPAID=1",
"pib_perc": "pib_municipios.xls",
"taxa_hom": "taxa-homicidios.csv",
"nota_ideb": "ideb.xlsx"
}

for key in dados_econ:
    if key == "distancia":
        df_econ_mun = pd.read_csv(dados_econ[key], 
            skiprows=2, 
            usecols=[i for i in [1, 3]],
            names=["Codigo", key])
        print("Coluna",  key,"Criada!")
    else:
        if key == "pib_perc":
            df2 = pd.read_excel(dados_econ[key])
            df2 = df2[df2["Ano"] == 2019][["Código do Município", "Produto Interno Bruto, \na preços correntes\n(R$ 1.000)", "Atividade com maior valor adicionado bruto"]]
            df2.rename(columns={
                "Código do Município": "Codigo",
                "Produto Interno Bruto, \na preços correntes\n(R$ 1.000)": "pib_percap",
                "Atividade com maior valor adicionado bruto": "atv_princ"
            }, inplace=True)
            df_econ_mun = df_econ_mun.merge(df2, left_on="Codigo", right_on="Codigo", how="left")
            print("Coluna",  key,"Criada!")
        else:
            if key == "taxa_hom":
                df2 = pd.read_csv(dados_econ[key], 
                                  delimiter=";", 
                                  usecols=[i for i in [0, 2, 3]], 
                                  names=["Codigo", "ano", key], skiprows=1)
                df2 = df2[df2["ano"] == 2019]
                df2.drop("ano", axis=1, inplace=True)
                df_econ_mun = df_econ_mun.merge(df2, left_on="Codigo", right_on="Codigo", how="left")
                print("Coluna",  key,"Criada!")
            else: 
                if key == "nota_ideb":
                    df2 = pd.read_excel(dados_econ[key], usecols=[i for i in [1, 4]], names=["Codigo", key])
                    new_l = []
                    for i in df2.nota_ideb.to_list():
                        j = str(i).replace("-", "")
                        new_l.append(j)
                    df2['nota_ideb'] = pd.to_numeric(new_l)
                    df_econ_mun = df_econ_mun.merge(df2, left_on="Codigo", right_on="Codigo", how='left')
                    print("Coluna",  key,"Criada!")
                else:
                    df2 = pd.read_csv(dados_econ[key], 
                                      skiprows=2, 
                                      usecols=[i for i in [1, 3]],
                                      names=["Codigo", key])
                    df_econ_mun = df_econ_mun.merge(df2, left_on="Codigo", right_on="Codigo", how="left")
                    print("Coluna",  key,"Criada!")
                    
df_econ_mun['Codigo'] = pd.to_numeric(df_econ_mun['Codigo'], downcast='float')
del df2, dados_econ
print("Dataframe 'df_econ_mun' criado!")

Coluna distancia Criada!
Coluna populacao Criada!
Coluna custeio Criada!
Coluna pessoal Criada!
Coluna pib_perc Criada!
Coluna taxa_hom Criada!
Coluna nota_ideb Criada!
Dataframe 'df_econ_mun' criado!


df_mun_of = df_mun_of.merge(df_econ_mun, left_on='Codigo', right_on='Codigo')
del df_econ_mun


# Salvando em um arquivo csv
df_mun_of.reset_index(drop=True, inplace=True)
df_mun_of.to_csv('eleicao_municipios.csv', index = False)


df_mun_of.head()


df_mun_of.head()


df_mun_of.dtypes

num_cand       object
vot_abs         int64
eleito         object
uf             object
ufr            object
Codigo        float64
vot_perc      float64
partido        object
municipio      object
latitude      float64
longitude     float64
distancia     float64
populacao     float64
custeio       float64
pessoal       float64
pib_percap    float64
atv_princ      object
taxa_hom      float64
nota_ideb     float64
dtype: object


df_mun_of.isna().sum()

num_cand         0
vot_abs          0
eleito           0
uf               0
ufr              0
Codigo           0
vot_perc         0
partido          0
municipio        0
latitude         0
longitude        0
distancia      693
populacao        0
custeio        165
pessoal        165
pib_percap       0
atv_princ        0
taxa_hom        99
nota_ideb     5467
dtype: int64


df_mun_of.shape

(61270, 19)


df_mun_of.loc[df_mun_of.municipio == "Brasília"]


df_mun_of.distancia.fillna(value=df_mun_of.distancia.mean(), inplace=True)
df_mun_of.custeio.fillna(value=df_mun_of.custeio.mean(), inplace=True)
df_mun_of.pessoal.fillna(value=df_mun_of.pessoal.mean(), inplace=True)
df_mun_of.taxa_hom.fillna(value=df_mun_of.taxa_hom.median(), inplace=True)
df_mun_of.nota_ideb.fillna(value=df_mun_of.nota_ideb.median(), inplace=True)


df_mun_of.isna().sum()

num_cand      0
vot_abs       0
eleito        0
uf            0
ufr           0
Codigo        0
vot_perc      0
partido       0
municipio     0
latitude      0
longitude     0
distancia     0
populacao     0
custeio       0
pessoal       0
pib_percap    0
atv_princ     0
taxa_hom      0
nota_ideb     0
dtype: int64


df_mun_of.shape

(61270, 19)


df_mun_of.head()


df_filtered = df_mun_of[(df_mun_of['partido'] == 'PT') | (df_mun_of['partido'] == 'PL')]
df_filtered.reset_index(drop=True, inplace=True)


df_filtered.isna().sum()

num_cand      0
vot_abs       0
eleito        0
uf            0
ufr           0
Codigo        0
vot_perc      0
partido       0
municipio     0
latitude      0
longitude     0
distancia     0
populacao     0
custeio       0
pessoal       0
pib_percap    0
atv_princ     0
taxa_hom      0
nota_ideb     0
dtype: int64


df_filtered['custeio_perc'] = df_filtered['custeio'] / df_filtered['populacao']
df_filtered['pessoal_perc'] = df_filtered['pessoal'] / df_filtered['populacao']


df_filtered.shape

(11140, 21)


df_filtered = df_filtered.loc[df_filtered.groupby('Codigo')['vot_perc'].idxmax(),]
df_filtered.reset_index(drop=True, inplace=True)


df_filtered.head()


df_filtered.shape

(5570, 21)


df_filtered.groupby('partido').mean()[['vot_perc', 'vot_abs', 'populacao', 'custeio', 'pessoal', 'pib_percap', 'taxa_hom', 'nota_ideb', 'custeio_perc', 'pessoal_perc']]


fig = px.scatter(df_filtered, x="pib_percap", y="vot_perc", color="partido", log_x=True,
                 hover_name="municipio", hover_data=["uf", "partido", "vot_perc", "vot_abs"],
                 color_discrete_map={
                     "PT": "#EF553B",
                     "PL": "#636EFA"
                }, template="simple_white", 
                labels={'partido':'Vencedor', "pib_percap": "PIB per capita", "uf": "Estado", 
                        "vot_perc": "% Votação", "vap": "vot_abs"})

fig.update_layout(legend=dict(
    title="Partido"
))

fig.update_xaxes(title="PIB per capita (log)")
fig.update_yaxes(title="Porcentagem")
fig.update_layout(title={
        'text': "Relação: Pib Per Capita x % Votação",
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'})

fig.show(renderer="jpg")


fig = px.histogram(df_filtered, x="nota_ideb", facet_col="partido", histnorm='probability',
                   nbins=32, template="simple_white", color="partido", color_discrete_map={"PT": "#EF553B",
                                                                                           "PL": "#636EFA"})

fig.update_layout(showlegend=False)

fig.update_xaxes(title="IDEB")
fig.update_yaxes(title="Probabilidade")
fig.update_layout(title={
        'text': "Histograma: Nota IDEB x Partido",
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'})
fig.add_vline(x=df_filtered[df_filtered["partido"] == "PL"]["nota_ideb"].mean(), line_width=3, line_dash="dash", line_color="black", col=1, row=1,
              annotation_text= "Média IDEB: {:.2f}".format(df_filtered[df_filtered["partido"] == "PL"]["nota_ideb"].mean()))
fig.add_vline(x=df_filtered[df_filtered["partido"] == "PT"]["nota_ideb"].mean(), line_width=3, line_dash="dash", line_color="black", col=2, row=1,
              annotation_text= "Média IDEB: {:.2f}".format(df_filtered[df_filtered["partido"] == "PT"]["nota_ideb"].mean()))

fig.show(renderer="jpg")


fig = go.Figure()

fig.add_trace(go.Histogram(x = df_filtered[df_filtered["partido"] == "PL"]["nota_ideb"], name="PL", 
                           xbins=dict(
                            start=0,
                            end=7.65,
                            size=0.4), marker_color="#636EFA"))


fig.add_trace(go.Histogram(x = df_filtered[df_filtered["partido"] == "PT"]["nota_ideb"], name="PT", 
                           xbins=dict(
                            start=0,
                            end=7.65,
                            size=0.4), marker_color="#EF553B"))

# Overlay para ambos histogramas
fig.update_layout(barmode="overlay", 
                  template="simple_white",
                 legend=dict(
                title="Partido"),
                 title={
                     "text":"Sobreposição Histogramas Nota IDEB",
                     "y":0.95,
                     "x": 0.5,
                     "xanchor": "center",
                     "yanchor": "top"
                 })
fig.update_traces(opacity=0.75)

fig.show(renderer="jpg")


fig = px.box(df_filtered, y="partido", x="custeio_perc", points="all", hover_data=["uf", "partido", "vot_perc", "vot_abs"],
             hover_name="municipio", color="partido", template="simple_white", 
                 color_discrete_map={
                     "PT": "#EF553B",
                     "PL": "#636EFA"
                 })

fig.update_xaxes(title="Partido")
fig.update_yaxes(title="Custeio da Máquina (log)")
fig.update_layout(showlegend=False,
                  title={
                      "text":"Boxplot: Custeio da Máquina x Voto no Partido",
                      "y":0.95,
                      "x":0.5,
                      "xanchor":"center",
                      "yanchor":"top"
                  })
fig.update_traces()

fig.show(renderer="jpg")


fig = px.scatter(df_filtered, x="pib_percap", y="pessoal", color="partido", log_x=True, log_y=True,
                 hover_name="municipio", hover_data=["uf", "partido", "vot_perc", "vot_abs"],
                 color_discrete_map={
                     "PT": "#EF553B",
                     "PL": "#636EFA"
                }, template="simple_white", 
                labels={'partido':'Vencedor', "pib_percap": "PIB per capita", "uf": "Estado", 
                        "vot_perc": "% Votação", "vap": "vot_abs"})

fig.update_layout(legend=dict(
    title="Partido"
))

fig.update_xaxes(title="PIB per capita (log)")
fig.update_yaxes(title="Gasto com Pessoal (log)")
fig.update_layout(title={
        'text': "Relação: Gasto Pessoal x Pib per capita",
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'})

fig.show(renderer="jpg")


fig = px.box(df_filtered, x="taxa_hom", y="partido", points="all", hover_data=["uf", "partido", "vot_perc", "vot_abs"],
             hover_name="municipio", color="partido", template="simple_white", 
                 color_discrete_map={
                     "PT": "#EF553B",
                     "PL": "#636EFA"
                 })

fig.update_xaxes(title="Taxa de Homicídio")
fig.update_yaxes(title="Partido")
fig.update_layout(showlegend=False,
                  title={
                      "text":"Boxplot: Taxa de Homicídio x Voto no Partido",
                      "y":0.95,
                      "x":0.5,
                      "xanchor":"center",
                      "yanchor":"top"
                  })

fig.show(renderer="jpg")


vpop = df_filtered[(df_filtered.vot_abs / df_filtered.populacao) < 1]

fig = px.scatter(vpop, x="distancia", y=(vpop.vot_abs / vpop.populacao), color="partido", hover_name="municipio", 
                 template="simple_white", hover_data=["uf", "partido", "vot_perc", "vot_abs"],
                 color_discrete_map={
                     "PT": "#EF553B",
                     "PL": "#636EFA"
                 }, log_y=True)

fig.update_layout(legend=dict(
    title="Partido"
))

fig.update_yaxes(title={
    'text': None
}, showticklabels=False, ticks="", visible=False)
fig.update_xaxes(title={
    'text': 'Km'
}, tickangle=45)
fig.update_layout(title={
        'text': "Distância da Capital x Votação",
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'}, xaxis_range=[0,1500])

fig.show(renderer="jpg")


fig = px.bar(df_filtered.groupby('partido').agg(count = ('Codigo', 'count')).reset_index(), 
             x='partido', y='count', color='partido', template='simple_white', labels={'partido':'Partido', 
                                                                                       "count": "N Municípios"},
            color_discrete_map={'PT':'#EF553B',
                                'PL':'#636EFA'})

fig.update_yaxes(title={
    'text': None
}, showticklabels=False, ticks="", visible=False)
fig.update_xaxes(title={
    'text': None
})

fig.update_layout(title={
        'text': "Quantidade de Municípios por Candidato",
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'}, showlegend=False, bargap=0.01)

fig.show(renderer="jpg")


modified = df_filtered.groupby(['partido', 'atv_princ']).agg(count = ('Codigo', 'count')).reset_index().sort_values('count', ascending=False)
modified['n_mun'] = np.where(np.array(df_filtered.groupby(['partido', 
                              'atv_princ']).agg(count = ('Codigo', 
                                                         'count')).reset_index().sort_values('count', 
                                                                                             ascending=False)['partido'].to_list()) == "PT", 3378, 2192)
modified['percent'] = (modified['count'] / modified['n_mun'])*100
modified.sort_values(['partido', 'percent'], ascending=False, inplace=True)
modified.reset_index(drop=True, inplace=True)
modified


fig = px.bar(modified, x="atv_princ", y="percent", color='partido', barmode='group', template='simple_white',
             color_discrete_map={'PT':'#EF553B',
                                'PL':'#636EFA'}, text='atv_princ', labels={'partido':'Partido', 
                                                                           'atv_princ': 'Atv Principal',
                                                                           'percent': 'Percentual'}, log_y=True)

fig.update_xaxes(title={
    'text': None
}, showticklabels=False, ticks="", visible=True)

fig.update_yaxes(title={
    'text': None
}, showticklabels=False, ticks="", visible=False)

fig.update_layout(title={
        'text': "Atividade dos Municípios por Candidato",
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'},
                 legend={'title':'Partido', 'y':0.5},
                 bargap=0.15)

fig.show(renderer="jpg")


with urlopen('https://raw.githubusercontent.com/tbrugz/geodata-br/master/geojson/geojs-100-mun.json') as response:
    geojson = json.load(response)
    
df_filtered['id'] = (df_filtered.Codigo.astype(int)).astype(str)

fig = px.choropleth(
        df_filtered, geojson=geojson, color="partido", hover_name="municipio", hover_data=["uf", "partido", "vot_perc", "vot_abs"],
        locations="id", featureidkey="properties.id",
        projection="mercator", 
        labels={'partido':'Vencedor', "id": "ID", "uf": "Estado", "vot_perc": "% Votação", "vot_abs": "Votos"},
        color_discrete_map={
                     "PT": "#EF553B",
                     "PL": "#636EFA"})

fig.update_traces(marker_line_width=0, marker_line_color='black')
fig.update_geos(fitbounds="locations", visible=False, resolution=50)

fig.update_layout(margin={"r":0,"t":0,"l":0,"b":0}, legend=dict(
    title="Partido"
), title={
        'text': "Primeiro Turno: Municípios",
        'y':0.98,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'})

fig.show(renderer="jpg")


# Encoder coluna atv principal
le = LabelEncoder()
coder = le.fit_transform(df_filtered.atv_princ.to_list())
df_filtered['atv_princ_encoder'] = coder

# Separaçao das variáveis
X = df_filtered[['distancia', 'populacao', 'custeio_perc', 'pessoal_perc', 'pib_percap', 'atv_princ_encoder', 'taxa_hom',
                 'nota_ideb']]
y = df_filtered['partido']

# Normalização dos dados
X_min_max = MinMaxScaler().fit_transform(X)

# Divisão em dados de treino e de teste
X_train, X_test, y_train, y_test = train_test_split(X_min_max, y, stratify=y, shuffle=True)

# Treinamento e previsão do Modelo
model = LogisticRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)


print("Relatório de Classificação:\n")
print(classification_report(y_true=y_test, y_pred=y_pred))

print("\n\n")
print("Array da Matriz de Confusão:")
print(confusion_matrix(y_test, y_pred, labels=model.classes_))

print("\n")
print("Visualização da Matriz de Confusão:")
disp = ConfusionMatrixDisplay(confusion_matrix=confusion_matrix(y_test, y_pred, labels=model.classes_, normalize='true'),
                       display_labels=model.classes_).plot()

Relatório de Classificação:

              precision    recall  f1-score   support

          PL       0.71      0.66      0.69       548
          PT       0.79      0.82      0.81       845

    accuracy                           0.76      1393
   macro avg       0.75      0.74      0.75      1393
weighted avg       0.76      0.76      0.76      1393


Array da Matriz de Confusão:
[[364 184]
 [150 695]]


Visualização da Matriz de Confusão:


# Gerando gerando as previsões para todos
y_pred_all = model.predict(X_min_max)

# Criando dataframe
df_prev = X.copy() 
df_prev['partido'] = y_pred_all.tolist()
df_prev['id'] = df_filtered.id
df_prev['municipio'] = df_filtered.municipio
df_prev['uf'] = df_filtered.uf

# Gerando a visualização
fig = px.choropleth(
        df_prev, geojson=geojson, color="partido", hover_name="municipio", hover_data=["uf", "partido"],
        locations="id", featureidkey="properties.id",
        projection="mercator", 
        labels={'partido':'Vencedor', "id": "ID", "uf": "Estado"},
        color_discrete_map={
                     "PT": "#EF553B",
                     "PL": "#636EFA"})

fig.update_traces(marker_line_width=0, marker_line_color='black')
fig.update_geos(fitbounds="locations", visible=False, resolution=50)

fig.update_layout(margin={"r":0,"t":0,"l":0,"b":0}, legend=dict(
    title="Partido"
), title={
        'text': "Primeiro Turno: Municípios",
        'y':0.98,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'})

fig.show(renderer="jpg")


# PT = 1, PL = 0
y_encoder = le.fit_transform(y_train)
logit_model = sm.Logit(y_encoder, X_train)
result=logit_model.fit()
print(result.summary())
print(X.columns)

Optimization terminated successfully.
         Current function value: 0.584745
         Iterations 6
                           Logit Regression Results                           
==============================================================================
Dep. Variable:                      y   No. Observations:                 4177
Model:                          Logit   Df Residuals:                     4169
Method:                           MLE   Df Model:                            7
Date:                Thu, 20 Oct 2022   Pseudo R-squ.:                  0.1277
Time:                        23:11:08   Log-Likelihood:                -2442.5
converged:                       True   LL-Null:                       -2799.9
Covariance Type:            nonrobust   LLR p-value:                4.172e-150
==============================================================================
                 coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
x1             2.6836      0.322      8.326      0.000       2.052       3.315
x2            12.5824      7.820      1.609      0.108      -2.744      27.909
x3            -3.7871      4.502     -0.841      0.400     -12.611       5.037
x4             5.3214      4.826      1.103      0.270      -4.137      14.780
x5           -12.8349      8.540     -1.503      0.133     -29.573       3.903
x6            -2.9154      0.152    -19.229      0.000      -3.213      -2.618
x7             5.6058      0.380     14.770      0.000       4.862       6.350
x8            -0.3194      0.222     -1.437      0.151      -0.755       0.116
==============================================================================
Index(['distancia', 'populacao', 'custeio_perc', 'pessoal_perc', 'pib_percap',
       'atv_princ_encoder', 'taxa_hom', 'nota_ideb'],
      dtype='object')

	num_cand	vot_abs	eleito	uf	ufr	Codigo	vot_perc	partido	municipio	latitude	longitude	distancia	populacao	custeio	pessoal	pib_percap	atv_princ	taxa_hom	nota_ideb
0	44	37	Não eleito	ACRE	AC	1200013.0	0.52	UNIAO	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
1	13	1516	2º turno	ACRE	AC	1200013.0	21.30	PT	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
2	15	192	Não eleito	ACRE	AC	1200013.0	2.70	MDB	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
3	16	1	Não eleito	ACRE	AC	1200013.0	0.01	PSTU	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
4	22	5238	2º turno	ACRE	AC	1200013.0	73.59	PL	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2

	num_cand	vot_abs	eleito	uf	ufr	Codigo	vot_perc	partido	municipio	latitude	longitude	distancia	populacao	custeio	pessoal	pib_percap	atv_princ	taxa_hom	nota_ideb
0	44	37	Não eleito	ACRE	AC	1200013.0	0.52	UNIAO	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
1	13	1516	2º turno	ACRE	AC	1200013.0	21.30	PT	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
2	15	192	Não eleito	ACRE	AC	1200013.0	2.70	MDB	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
3	16	1	Não eleito	ACRE	AC	1200013.0	0.01	PSTU	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
4	22	5238	2º turno	ACRE	AC	1200013.0	73.59	PL	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2

	num_cand	vot_abs	eleito	uf	ufr	Codigo	vot_perc	partido	municipio	latitude	longitude	populacao	custeio	pessoal	pib_percap	atv_princ	taxa_hom	nota_ideb
8833	14	1554	Não eleito	DISTRITO FEDERAL	DF	5300108.0	0.09	PTB	Brasília	-15.7795	-47.9297	3039444.0	NaN	NaN	2.736137e+08	Demais serviços	15.92	5.9
8834	16	454	Não eleito	DISTRITO FEDERAL	DF	5300108.0	0.03	PSTU	Brasília	-15.7795	-47.9297	3039444.0	NaN	NaN	2.736137e+08	Demais serviços	15.92	5.9
8835	21	894	Não eleito	DISTRITO FEDERAL	DF	5300108.0	0.05	PCB	Brasília	-15.7795	-47.9297	3039444.0	NaN	NaN	2.736137e+08	Demais serviços	15.92	5.9
8836	27	518	Não eleito	DISTRITO FEDERAL	DF	5300108.0	0.03	DC	Brasília	-15.7795	-47.9297	3039444.0	NaN	NaN	2.736137e+08	Demais serviços	15.92	5.9
8837	12	74308	Não eleito	DISTRITO FEDERAL	DF	5300108.0	4.22	PDT	Brasília	-15.7795	-47.9297	3039444.0	NaN	NaN	2.736137e+08	Demais serviços	15.92	5.9
8838	30	10342	Não eleito	DISTRITO FEDERAL	DF	5300108.0	0.59	NOVO	Brasília	-15.7795	-47.9297	3039444.0	NaN	NaN	2.736137e+08	Demais serviços	15.92	5.9
8839	15	105377	Não eleito	DISTRITO FEDERAL	DF	5300108.0	5.98	MDB	Brasília	-15.7795	-47.9297	3039444.0	NaN	NaN	2.736137e+08	Demais serviços	15.92	5.9
8840	44	7935	Não eleito	DISTRITO FEDERAL	DF	5300108.0	0.45	UNIAO	Brasília	-15.7795	-47.9297	3039444.0	NaN	NaN	2.736137e+08	Demais serviços	15.92	5.9
8841	80	1262	Não eleito	DISTRITO FEDERAL	DF	5300108.0	0.07	UP	Brasília	-15.7795	-47.9297	3039444.0	NaN	NaN	2.736137e+08	Demais serviços	15.92	5.9
8842	13	649534	2º turno	DISTRITO FEDERAL	DF	5300108.0	36.85	PT	Brasília	-15.7795	-47.9297	3039444.0	NaN	NaN	2.736137e+08	Demais serviços	15.92	5.9
8843	22	910397	2º turno	DISTRITO FEDERAL	DF	5300108.0	51.65	PL	Brasília	-15.7795	-47.9297	3039444.0	NaN	NaN	2.736137e+08	Demais serviços	15.92	5.9

	num_cand	vot_abs	eleito	uf	ufr	Codigo	vot_perc	partido	municipio	latitude	longitude	distancia	populacao	custeio	pessoal	pib_percap	atv_princ	taxa_hom	nota_ideb
0	44	37	Não eleito	ACRE	AC	1200013.0	0.52	UNIAO	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
1	13	1516	2º turno	ACRE	AC	1200013.0	21.30	PT	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
2	15	192	Não eleito	ACRE	AC	1200013.0	2.70	MDB	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
3	16	1	Não eleito	ACRE	AC	1200013.0	0.01	PSTU	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2
4	22	5238	2º turno	ACRE	AC	1200013.0	73.59	PL	Acrelândia	-9.82581	-66.8972	102.925123	14366.0	21468597.9	17851184.46	253609.712	Administração, defesa, educação e saúde públic...	32.77	5.2

	num_cand	vot_abs	eleito	uf	ufr	Codigo	vot_perc	partido	municipio	latitude	...	distancia	populacao	custeio	pessoal	pib_percap	atv_princ	taxa_hom	nota_ideb	custeio_perc	pessoal_perc
0	22	9034	2º turno	RONDÔNIA	RO	1100015.0	65.86	PL	Alta Floresta D'Oeste	-11.92830	...	413.957085	25437.0	4.315441e+07	3.711541e+07	495628.767	Administração, defesa, educação e saúde públic...	34.87	4.8	1696.521245	1459.111232
1	22	36941	2º turno	RONDÔNIA	RO	1100023.0	73.52	PL	Ariquemes	-9.90571	...	158.768710	107345.0	1.609147e+08	1.487715e+08	2578829.725	Demais serviços	35.23	4.7	1499.042183	1385.919438
2	22	2206	2º turno	RONDÔNIA	RO	1100031.0	62.76	PL	Cabixi	-13.49450	...	639.017040	6224.0	1.648121e+07	1.272046e+07	139959.390	Administração, defesa, educação e saúde públic...	0.00	5.1	2648.008678	2043.775101
3	22	34681	2º turno	RONDÔNIA	RO	1100049.0	69.55	PL	Cacoal	-11.43430	...	400.204776	88507.0	1.239290e+08	1.110954e+08	2260643.565	Demais serviços	24.60	5.7	1400.217159	1255.215643
4	22	7323	2º turno	RONDÔNIA	RO	1100056.0	74.73	PL	Cerejeiras	-13.18700	...	594.969020	17934.0	2.992989e+07	2.357524e+07	506854.457	Comércio e reparação de veículos automotores e...	18.38	5.7	1668.891156	1314.555401

Primeiro Turno Presidencial - Eleições 2022: Municípios¶

Importando as Bibliotecas Necessárias¶

Obtenção e Limpeza dos Dados¶

Análise Exploratória¶

Visualização Gráfica¶

CLIQUE AQUI PARA ACESSAR ESSE GRÁFICO DE FORMA INTERATIVA

CLIQUE AQUI PARA ACESSAR ESSE GRÁFICO DE FORMA INTERATIVA

CLIQUE AQUI PARA ACESSAR ESSE GRÁFICO DE FORMA INTERATIVA

CLIQUE AQUI PARA ACESSAR ESSE GRÁFICO DE FORMA INTERATIVA

CLIQUE AQUI PARA ACESSAR ESSE GRÁFICO DE FORMA INTERATIVA

CLIQUE AQUI PARA ACESSAR ESSE GRÁFICO DE FORMA INTERATIVA

CLIQUE AQUI PARA ACESSAR ESSE GRÁFICO DE FORMA INTERATIVA

CLIQUE AQUI PARA ACESSAR ESSE GRÁFICO DE FORMA INTERATIVA

CLIQUE AQUI PARA ACESSAR ESSE GRÁFICO DE FORMA INTERATIVA

CLIQUE AQUI PARA ACESSAR ESSE GRÁFICO DE FORMA INTERATIVA

Modelo de Machine Learning¶

CLIQUE AQUI PARA ACESSAR ESSE GRÁFICO DE FORMA INTERATIVA

Conclusão¶

Complemento¶

Obrigado pela leitura!¶

Repositório desse Projeto: Clique Aqui ¶

Contato:¶

	vot_perc	vot_abs	populacao	custeio	pessoal	pib_percap	taxa_hom	nota_ideb	custeio_perc	pessoal_perc
partido
PL	57.104448	14749.374544	47464.093978	9.656520e+07	8.613646e+07	2.045526e+06	14.128134	5.979745	2638.315347	2162.442408
PT	66.444381	10581.103316	30674.847543	5.526645e+07	4.853381e+07	8.600765e+05	21.377211	5.312966	2225.823389	1820.824094

	partido	atv_princ	count	n_mun	percent
0	PT	Administração, defesa, educação e saúde públic...	2306	3378	68.265246
1	PT	Demais serviços	528	3378	15.630551
2	PT	Agricultura, inclusive apoio à agricultura e a...	283	3378	8.377738
3	PT	Eletricidade e gás, água, esgoto, atividades d...	79	3378	2.338662
4	PT	Indústrias de transformação	68	3378	2.013025
5	PT	Pecuária, inclusive apoio à pecuária	37	3378	1.095323
6	PT	Indústrias extrativas	36	3378	1.065719
7	PT	Produção florestal, pesca e aquicultura	22	3378	0.651273
8	PT	Comércio e reparação de veículos automotores e...	16	3378	0.473653
9	PT	Construção	3	3378	0.088810
10	PL	Demais serviços	1136	2192	51.824818
11	PL	Administração, defesa, educação e saúde públic...	420	2192	19.160584
12	PL	Agricultura, inclusive apoio à agricultura e a...	301	2192	13.731752
13	PL	Indústrias de transformação	173	2192	7.892336
14	PL	Pecuária, inclusive apoio à pecuária	68	2192	3.102190
15	PL	Eletricidade e gás, água, esgoto, atividades d...	33	2192	1.505474
16	PL	Indústrias extrativas	28	2192	1.277372
17	PL	Comércio e reparação de veículos automotores e...	23	2192	1.049270
18	PL	Produção florestal, pesca e aquicultura	9	2192	0.410584
19	PL	Construção	1	2192	0.045620

Primeiro Turno Presidencial - Eleições 2022: Municípios¶

Importando as Bibliotecas Necessárias¶

Obtenção e Limpeza dos Dados¶

Análise Exploratória¶

Visualização Gráfica¶

Modelo de Machine Learning¶

Conclusão¶

Complemento¶

Obrigado pela leitura!¶

Repositório desse Projeto: Clique Aqui¶

Contato:¶

Repositório desse Projeto: Clique Aqui ¶