Mil tráficos - Piracicaba (Jan 2026)

Escopo

Este projeto automatiza a coleta, a extração de informações, o georreferenciamento e a análise com LLM de sentenças judiciais sobre tráfico de drogas em Piracicaba, extraídas do banco de sentenças do TJSP (informação pública).

Fluxo de Trabalho

Coleta de Dados: O script /src/prepara_dados.ipynb realiza web scraping com requests para baixar páginas com os julgados de interesse.

Extração de Informações: O conteúdo HTML é processado com BeautifulSoup4 para extrair as informações relevantes, como número do processo, vara, magistrado e texto completo da sentença, e as organiza em dataframe, usando pandas.

Análise com IA: O texto de cada sentença é analisado por um modelo de linguagem (no caso, usamos o gpt-5-nano), que extrai informações-chave como data do fato, local, quantidade de réus, modus operandi, alegações da defesa, resultado do processo e um resumo da decisão.

Georreferenciamento: O georreferenciamento foi feito com a api de geolocalização do Google.

Faça você mesmo

Instale as dependências necessárias (indicadas o arquivo pyproject.toml).
Altere as configurações de prepara_dados.ipynb de acordo com o seu ambiente.
Altere PARAMS_TJSP para analisar outros tipos de sentenças. Inspecione a página https://esaj.tjsp.jus.br/cjpg/pesquisar.do para entender como funcionam os parâmetros.
Modifique o prompt para obter novos resultados. Faça as alterações correspondentes no JSON de saída.
Perceba que o código contido em prepara_dados.ipynb cria o arquivo "csv" necessário para alimentar a aplicação. Esta, por sua vez, consiste no app view nativo do marimo.
Para exportar a aplicação e publicá-la no GitHub Pages, usamos o comando marimo export html-wasm src/plota_dados.py -o index.html --sandbox. O arquivo arquivo py original foi alterado para apontar para o arquivo csv carregado no GitHub (modo RAW).
Não se esqueça de configurar as chaves das APIs no arquivo .env, omitido neste repositório.

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
assets		assets
dados		dados
src		src
.gitignore		.gitignore
.nojekyll		.nojekyll
CLAUDE.md		CLAUDE.md
README.md		README.md
android-chrome-192x192.png		android-chrome-192x192.png
android-chrome-512x512.png		android-chrome-512x512.png
apple-touch-icon.png		apple-touch-icon.png
circle-check.ico		circle-check.ico
circle-play.ico		circle-play.ico
circle-x.ico		circle-x.ico
dados.csv		dados.csv
favicon-16x16.png		favicon-16x16.png
favicon-32x32.png		favicon-32x32.png
favicon.ico		favicon.ico
index.html		index.html
logo.png		logo.png
manifest.json		manifest.json
pyproject.toml		pyproject.toml
site.webmanifest		site.webmanifest
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Mil tráficos - Piracicaba (Jan 2026)

Escopo

Fluxo de Trabalho

Faça você mesmo

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

jespimentel/mil_traficos

Folders and files

Latest commit

History

Repository files navigation

Mil tráficos - Piracicaba (Jan 2026)

Escopo

Fluxo de Trabalho

Faça você mesmo

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages