Skip to content

jespimentel/mil_traficos

Repository files navigation

Mil tráficos - Piracicaba (Jan 2026)

Escopo

Este projeto automatiza a coleta, a extração de informações, o georreferenciamento e a análise com LLM de sentenças judiciais sobre tráfico de drogas em Piracicaba, extraídas do banco de sentenças do TJSP (informação pública).

Fluxo de Trabalho

Coleta de Dados: O script /src/prepara_dados.ipynb realiza web scraping com requests para baixar páginas com os julgados de interesse.

Extração de Informações: O conteúdo HTML é processado com BeautifulSoup4 para extrair as informações relevantes, como número do processo, vara, magistrado e texto completo da sentença, e as organiza em dataframe, usando pandas.

Análise com IA: O texto de cada sentença é analisado por um modelo de linguagem (no caso, usamos o gpt-5-nano), que extrai informações-chave como data do fato, local, quantidade de réus, modus operandi, alegações da defesa, resultado do processo e um resumo da decisão.

Georreferenciamento: O georreferenciamento foi feito com a api de geolocalização do Google.

Faça você mesmo

  • Instale as dependências necessárias (indicadas o arquivo pyproject.toml).

  • Altere as configurações de prepara_dados.ipynb de acordo com o seu ambiente.

  • Altere PARAMS_TJSP para analisar outros tipos de sentenças. Inspecione a página https://esaj.tjsp.jus.br/cjpg/pesquisar.do para entender como funcionam os parâmetros.

  • Modifique o prompt para obter novos resultados. Faça as alterações correspondentes no JSON de saída.

  • Perceba que o código contido em prepara_dados.ipynb cria o arquivo "csv" necessário para alimentar a aplicação. Esta, por sua vez, consiste no app view nativo do marimo.

  • Para exportar a aplicação e publicá-la no GitHub Pages, usamos o comando marimo export html-wasm src/plota_dados.py -o index.html --sandbox. O arquivo arquivo py original foi alterado para apontar para o arquivo csv carregado no GitHub (modo RAW).

  • Não se esqueça de configurar as chaves das APIs no arquivo .env, omitido neste repositório.

About

Análise e georreferenciamento do banco de sentenças do TJSP

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors