Transparencia navegável
6 de Agosto de 2012, 0:00 - sem comentários aindaColoquei no ar uma página em javascript que permite navegar pelos dados pré-processados do portal da transparência. A primeira tentativa tinha siso um sistema que calculasse as estatisticas em tempo real, mas não deu certo. Dado demais, o sistema não dava conta. Então o que eu fiz foi pré-processar os dados e publica-los em formato json. As paginas usam javascript para carregar esses dados e exibir de forma bonitinha. Links:
- Por órgão de lotação;
-
Por cargo
(cuidado, esse demora pra carregar pois são 1.1Mb de dados); - Por nome:
Essa separação entre militares e não militares tem dois motivos: os salários dos militares só estão disponíveis par ao mes de maio, e os dados divulgados no post anterior foram colhidos antes dos salários dos militares serem incluidos no portal da transparência. Os dados dos militares tem algumas peculiaridades que eu gostaria de discutir em outro post, como por exemplo o fato de as mulheres ganharem mais do que os homens, contrastando com o que ocorre entre os servidores civis.
Quem quiser os fontes dos programas usados para gerar as páginas, está no mesmo projeto do google code, em outro branch. (Versão atualizada)
Update:
Editei os links para a versão nova do programinha.
Similar Posts:
- As mulheres, os militares e as mulheres militares.
- Portal de Software Livre do Governo Federal
- UOL XMLify
- 2007 July 11 00:41:13 BRT
- 2007 June 12 16:33:52 BRT
Update sobre a fuçação
19 de Julho de 2012, 0:00 - sem comentários aindaGalera,
A CGU botou no ar hoje arquivos mais completos do que eles disponibilizavam antes (naquele mesmo link que eu citei no post original), em formato CSV, e dentro dele tem até mais informações do que as que eu “roubava” via wget. Vou adaptar meus programas e scripts e posto aqui novamente. (Os arquivos todos agora tem ID, então vai facilitar pra montar um banco, basta importar!)
.Similar Posts:
- Problemas com o Banco do Brasil
- 2007 July 15 11:01:09 BRT
- Fuçando a transparência
- A história do futebol nunca mais será a mesma…
- 2007 July 19 10:44:18 BRT
Fuçando a transparencia, parte 2
15 de Julho de 2012, 0:00 - sem comentários aindaOntem enquanto eu escrevia o post no blog eu percebi que os dados no site do portal da transparencia tinham sido atualizados. Então durante a noite (e boa parte do dia) de hoje eu fiz tudo de novo: baixei, extrai, gerei os bancos, etc. Com isso os valores das tabelas variam um pouquinho, a saber, na mesma ordem que elas ocorrem:
Nome | Qtd. | Média |
BANCO CENTRAL DO BRASIL | 4459 | R$ 16.737,60 |
ADVOCACIA-GERAL DA UNIAO | 7546 | R$ 15.088,26 |
CENTRO NAC.TECNO.ELETRONICA AVANCADA S.A | 7 | R$ 14.374,32 |
CONTROLADORIA-GERAL DA UNIAO | 2342 | R$ 14.247,22 |
INSTITUTO DE PESQUISA ECONOMICA APLICADA | 564 | R$ 14.184,95 |
SUPERINTENDENCIA DE SEGUROS PRIVADOS | 422 | R$ 13.678,75 |
MINISTERIO DA FAZENDA | 32596 | R$ 12.487,48 |
EMPRESA DE PESQUISA ENERGETICA | 8 | R$ 12.402,34 |
AGENCIA NACIONAL DE AGUAS | 328 | R$ 12.379,99 |
COMISSAO DE VALORES MOBILIARIOS | 564 | R$ 12.352,41 |
EMPRESA DE TRENS URBANOS DE PORTO ALEGRE | 13 | R$ 11.327,64 |
AGENCIA NAC PETROLEO GAS NAT BIOCOMBUSTI | 685 | R$ 11.301,15 |
MINISTERIO DAS RELACOES EXTERIORES | 1547 | R$ 11.129,46 |
AGENCIA NACIONAL DE VIGILANCIA SANITARIA | 1934 | R$ 10.952,20 |
AGENCIA NACIONAL DE SAUDE SUPLEMENTAR | 602 | R$ 10.804,12 |
AGENCIA NAC. DE TRANSPORTES AQUAVIARIOS | 331 | R$ 10.773,54 |
DEFENSORIA PUBLICA DA UNIAO | 790 | R$ 10.728,50 |
AGENCIA NACIONAL DE ENERGIA ELETRICA | 680 | R$ 10.692,32 |
DEPARTAMENTO DE POLICIA FEDERAL | 13653 | R$ 10.629,33 |
EMPRESA BRASILEIRA DE PESQ. AGROPECUARIA | 80 | R$ 10.608,95 |
Dá pra ver que muita coisa que parecia “lixo” sumiu dali. Devem ter dado uma limpa no banco. De resto, pros órgãos grandes, a coisa variou muito pouco.
A segunda tabela ficou também quase idêntica, mas dá pra ver que temos um diretor a mais no bacen, variando a média em menos de 10 reais.:
Ordem | Nome | Qtd. | Média |
1 | PRESIDENTE DO BANCO CENTRAL | 1 | R$ 26.723,13 |
2 | PRESIDENTA DA REPUBLICA | 1 | R$ 26.723,13 |
4 | DIRETOR SERVIDOR DO BANCO CENTRAL | 5 | R$ 26.544,65 |
7 | MINISTRO DE PRIMEIRA CLASSE | 56 | R$ 23.849,09 |
8 | MINISTRO DE ESTADO | 28 | R$ 22.932,80 |
10 | MINISTRO DE SEGUNDA CLASSE | 92 | R$ 21.803,70 |
11 | DELEGADO DE POLICIA CIVIL ESPECIAL | 16 | R$ 21.165,90 |
12 | DELEGADO DE POL FEDERAL CLASSE ESPECIAL | 401 | R$ 20.920,50 |
14 | TEC DE PLANEJ E PESQUISA-QUADRO SUPLEMEN | 15 | R$ 20.709,20 |
17 | PERITO CRIMINAL FEDERAL CLASSE ESPECIAL | 161 | R$ 20.121,84 |
19 | AUDITOR-FISCAL DA RECEITA FEDERAL BRASIL | 11555 | R$ 19.580,66 |
21 | CONSELHEIRO | 109 | R$ 19.460,44 |
24 | TECNICO DE PLANEJAMENTO | 70 | R$ 19.137,80 |
28 | AUDITOR FISCAL DO TRABALHO | 2993 | R$ 18.764,91 |
29 | ADVOGADO DA UNIAO | 1663 | R$ 18.649,92 |
32 | ANALISTA DO BANCO CENTRAL | 3588 | R$ 18.430,96 |
34 | PROCURADOR DO BANCO CENTRAL | 197 | R$ 18.286,05 |
36 | PROCURADOR FEDERAL | 4022 | R$ 18.122,84 |
37 | PROCURADOR DA FAZENDA | 1972 | R$ 18.100,70 |
38 | TECNICO DE PLANEJAMENTO E PESQUISA | 241 | R$ 17.943,75 |
E por ultimo, os nomes, maiores salários:
Nome | Conta | Média |
RICARDO | 3554 | R$ 8.329,88 |
EDUARDO | 3154 | R$ 8.185,49 |
MAURICIO | 1371 | R$ 8.118,06 |
MAURO | 1185 | R$ 8.112,45 |
SERGIO | 3519 | R$ 8.085,87 |
CELSO | 925 | R$ 8.013,91 |
MARCO | 1860 | R$ 7.983,56 |
ALEXANDRE | 2922 | R$ 7.973,82 |
MARIO | 1858 | R$ 7.969,51 |
FLAVIO | 1526 | R$ 7.943,72 |
mais numerosos:
Nome | Conta | Média |
MARIA | 31473 | R$ 6.323,33 |
JOSE | 23182 | R$ 6.737,69 |
ANTONIO | 10149 | R$ 6.785,85 |
ANA | 9114 | R$ 6.370,03 |
CARLOS | 8711 | R$ 7.431,25 |
PAULO | 8459 | R$ 7.608,78 |
JOAO | 8380 | R$ 6.781,19 |
LUIZ | 7963 | R$ 7.530,64 |
FRANCISCO | 7534 | R$ 6.400,11 |
MARCELO | 4283 | R$ 7.933,87 |
menores salários:
Nome | Qtd | Média |
CAMILA | 760 | R$ 4.270,70 |
DIEGO | 681 | R$ 4.611,94 |
PRISCILA | 597 | R$ 4.742,34 |
RAIMUNDA | 601 | R$ 4.841,21 |
ALINE | 1288 | R$ 4.937,33 |
ANDREIA | 629 | R$ 5.048,32 |
VANESSA | 955 | R$ 5.085,29 |
THIAGO | 1245 | R$ 5.088,57 |
FRANCISCA | 1297 | R$ 5.152,34 |
THAIS | 501 | R$ 5.202,00 |
Dá pra ver que em nenhuma tabela a mudança foi significativa, e não muda nada sobre as conclusões que tirei no outro post. Suponho que esses dados devam estar constantemente sendo atualizados, já que vem de um sistema online do governo, o SIAPE. Com isso, lotações de pessoas, erros nos nomes, etc, devem estar sendo corrigidos constantemente. Mais ainda com esse sistema no ar.Similar Posts:
- Fuçando a transparência
- Fuçando a transparência no senado
- Problemas com o Banco do Brasil
- De ministro a humorista é um pulo!
- Transparencia navegável
Fuçando a transparência
14 de Julho de 2012, 0:00 - sem comentários ainda
Acordando o blog depois de anos parado, o assunto de hoje é: Transparência.
O Governo Federal lançou recentemente no seu Portal da Transparência, um sistema que permite a consulta dos salários de todos os servidores. Polêmicas a parte (eu acho que os dados poderiam ser facilmente anonimizados, solucionando 90% dos pontos polêmicos e sem atrapalhar em nada), a ferramenta é bem pobrinha. Dá pra consultar servidor por servidor o quanto ele ganha. Tirando a curiosidade sobre autoridades específicas (presidente, ministros, etc), não serve pra absolutamente NADA! (Serve pra saber pra qual parente você vai pedir dinheiro emprestado e de qual parente você deve fugir pra não ter de emprestar, mas isso não tem PN a ver com transparência.). Do ponto de vista de transparência e utilidade pública, o portal deveria ter formas de se manipular e agrupar os dados, procurando padrões estranhos, anomalias, etc. Pra isso, ele não serve. Aí entra a fuçação (sic?)!
Baixar pra ter em mãos
Pra fuçar, é preciso ter os dados em mãos. Poder manipular, transformar, jogar pra cima, apertar, chamar de meu amor e tudo mais! Meu primeiro passo então nessa briga, foi de como obter esses dados. O site permite o download de uma parcela desses dados, basta clicar no link “baixar mais dados” logo acima da lista de nomes logo na primeira tela:
Só que esse arquivo não inclui o mais importante, que são os valores, os salários propriamente ditos. Inclui somente os dados de lotação do servidor (órgão, cargo, funções ocupadas, etc). Isso, sozinho, não serve pra quase nada (só pra contar quantas pessoas tem em cada órgão, porcentagens de funções gratificadas, e umas coisinhas interessantes que eu vou colocar mais em baixo). Eu ainda precisava da outra metade dos dados, que não existem em arquivinho pronto pra baixar. Aí a começa a fuçação.
Com cuspe, com jeito e um pouquinho de wget
Os dados de salário ficam em uma página separada. Pra chegar nela, preciso clicar no nome da pessoa, abrindo assim a tela com os cargos que ela ocupa, depois clicar novamente no botão de e finalmente abre-se uma tela com os valores de salário, descontos, rendimentos eventuais, etc. Baixar uma por uma as quase 700 mil páginas não era comigo.
A primeira coisa que fiz foi tentar identificar um jeito de automatizar isso. Notei que na URL havia sempre um campo numérico do tipo: IdServidor=XXXXXXX. Opa, bom demais. Isso provavelmente é a chave desses registros no banco de dados, e deve ser um valor seqüencial. Fiz alguns testes e cheguei a conclusão que dava pra fazer! Dava pra baixar tudo usando esse ID. Só que esse “IdServidor” não aparecia no arquivo baixado. Eu ia ter de improvisar pra saber quais eram os valores válidos pra ele. Busca binária, descobri o primeiro valor em 1000000 e o ultimo em 1691091 1. Agora era só baixar usando wget:
for ((i=1000000;i<1691092;i++))
do wget 'http://www.portaltransparencia.gov.br/servidores/Servidor-DetalhaRemuneracao.asp?Op=1&IdServidor='${i} -O salario.${i}.html -o /dev/null &
if [ $((i%100)) -eq 0 ]
then echo "echo waiting for $i"
wait;
fi
done
(note que eu rodo 100 processos em background pra aumentar o nível de paralelismo. na época o site estava bem lento, então foi necessário fazer isso. Agora já não sei como está e pode não ser a forma ideal).
Pronto, os dados estavam todos ali. Agora só precisava “extrair” eles dos htmls e transformar em algo mais processável.
e PERL, não se esqueça do PERL…
Pois é.. e toca analisar os htmls pra ver como os dados estão estruturados ali e depois fazer um parser, quanto mais meia boca melhor, afinal é PERL, pra cuspir esses dados em formato “de gente”. No caso, “de gente” era um CSV. O programinha em perl pra processar essa galerinha aí foi esse aqui ó: parse.pl. Nada de mais. Só espera pelas coisas certas nos lugares certos. Eu acabei optando por ignorar uma série de coisas como 13, férias, jetons, etc, e me ative só ao “importante”: salário bruto, “Abate Teto”, imposto, previdência e o salário líquido. Na verdade nem o líquido eu acho útil, já que ele inclui férias ou 13 de um monte de gente. Qualquer conta feita pelo líquido fica distorcida por causa desses pagamentos eventuais. No fundo, eu sempre olho pelo salário bruto menos o abate do teto (estritamente falando, é “mais”, porque já vem negativo) que é a conta que melhor dá uma idéia da situação das coisas.
E pra juntar tudo?
Pois é… E pra juntar tudo? Agora tava na hora, eu tinha descobrir um jeito. Mas pra começar eu achei que colocando tudo num banco de dados ficaria mais fácil de achar um jeito de casar um arquivo com o outro. Foi mais fácil que eu pensava. O Mysql importa de arquivo csv. Criei toscamente as tabelas com todos os campos varchar(255), importei e fui fuçar. A primeira coisa que tentei foi pelo nome. SELECT nome, COUNT(*) FROM salario GROUP BY nome HAVING COUNT(*) > 1
me deu uma péssima surpresa… cheio de gente com nome igual… Mas o CPF deles era diferente… Será? bora então! SELECT nome, cpf, COUNT(*) FROM salario GROUP BY nome, cpf HAVING COUNT(*) > 1
.
BINGO!
Nenhuma repetição! Usando o CPF mais o nome eu consigo identificar unicamente todos os servidores, e consigo “casar” uma tabela com a outra. Acrescentei logo um campo “id_servidor” na tabela de servidores e preenchi: UPDATE servidor SET id_servidor = (SELECT id_servidor FROM salario WHERE salario.cpf = servidor.cpf AND salario.nome = servidor.nome);
. Voilá! Temos as duas tabelas relacionadas e podemos brincar de fuçar!
Fuçar na mão, também não né?
Fiz um monte de queries, pensei num monte de coisas, mas a coisa tava começando a ficar chata e repetitiva. Resolvi sistematizar isso tudo num programinha. Como surgiu uma discussão sobre grails com uma galera na mesma semana, o povo querendo saber se valia a pena usar em produção, etc, resolvi fazer em grails uma aplicaçãozinha de fuçar os dados. Minha idéia seria que facilitaria minha vida usar hql/hibernate ao invés de SQL puro.
Ledo engano!
Hibernate e HQL se mostraram lentos demais pro que eu queria fazer. É muito dado, muita manipulação de conjuntos grandes. Muito group by, inner queries, etc. Enfim, não rolou. Acabei fazendo tudo em SQL e usando o grails só mesmo como plataforma pra jogar os dados na web de forma bonitinha. No final, joguei tudo pra dentro do grails mesmo. A importação dos CSVs, a validação dos dados, a denormalização (que eu não tinha feito quando era só no sql), e ainda fiz um passo extra de tokenização dos nomes, que vai ser útil mais pra frente. O fonte dele está disponível no google code. Basta rodar com “grails run-app” dentro da raiz dele e ele já te manda pra tela de carga dos dados no primeiro acesso. Daqui pra frente ignorem meu banco original descrito lá pra cima. Vamos usar o banco gerado pela aplicação grails, beleza?
O que eu achei?
Pouca coisa interessante saiu no começo. A pior delas foi descobrir que fiz besteira! O banco central é o órgão que, na média, melhor paga no governo federal (mentira, não tem os dados do legislativo e TCU ou senado provavelmente pagam ainda melhor). Tivesse continuado por lá, tava rico: a média salarial por lá é de R$ 16.734,28. Bem a frente da AGU e da CGU que são os próximos “grandes” na lista. Uma tabelinha abaixo com os 20 primeiros. Destaque pros que tem gente suficiente pra média ser significativa:
Órgão de Lotação | Qtd. | Média |
EMPRESA BRAS. DE SERVICOS HOSPITALARES | 2 | R$ 26.723,14 |
CENTRO NAC.TECNO.ELETRONICA AVANCADA S.A | 8 | R$ 20.146,68 |
EMPRESA DE PESQUISA ENERGETICA | 9 | R$ 17.147,72 |
BANCO CENTRAL DO BRASIL | 4483 | R$ 16.734,28 |
EMPRESA DE TRENS URBANOS DE PORTO ALEGRE | 12 | R$ 15.310,35 |
NUCLEBRAS EQUIPAMENTOS PESADOS | 10 | R$ 15.108,61 |
ADVOCACIA-GERAL DA UNIAO | 7547 | R$ 15.093,39 |
CONTROLADORIA-GERAL DA UNIAO | 2343 | R$ 14.247,21 |
INSTITUTO DE PESQUISA ECONOMICA APLICADA | 564 | R$ 14.184,95 |
SUPERINTENDENCIA DE SEGUROS PRIVADOS | 422 | R$ 13.678,70 |
MINISTERIO DA FAZENDA | 32606 | R$ 12.487,78 |
AGENCIA NACIONAL DE AGUAS | 328 | R$ 12.379,99 |
COMISSAO DE VALORES MOBILIARIOS | 564 | R$ 12.355,82 |
AGENCIA NAC PETROLEO GAS NAT BIOCOMBUSTI | 686 | R$ 11.296,41 |
GOVERNO DO ESTADO DA BAHIA | 1 | R$ 11.179,36 |
MINISTERIO DAS RELACOES EXTERIORES | 1549 | R$ 11.119,07 |
EMPRESA BRASILEIRA DE PESQ. AGROPECUARIA | 86 | R$ 11.035,41 |
AGENCIA NACIONAL DE VIGILANCIA SANITARIA | 1937 | R$ 10.944,00 |
AGENCIA NACIONAL DE SAUDE SUPLEMENTAR | 599 | R$ 10.823,87 |
AGENCIA NAC. DE TRANSPORTES AQUAVIARIOS | 331 | R$ 10.773,54 |
Mas aí entra um probleminha: a Receita Federal nem aparece. São todos lotados como “Ministério da Fazenda”, (o que está certo, já que ela não é um órgão independente, mas uma secretaria do ministério). Dá pra ter uma idéia melhor de quem recebe mais pegando a descrição dos cargos:
Posição | Nome | Qtd. | Média |
1 | PRESIDENTE DO BANCO CENTRAL | 1 | R$ 26.723,13 |
2 | PRESIDENTA DA REPUBLICA | 1 | R$ 26.723,13 |
4 | DIRETOR SERVIDOR DO BANCO CENTRAL | 4 | R$ 26.376,98 |
7 | MINISTRO DE PRIMEIRA CLASSE | 56 | R$ 23.849,09 |
8 | MINISTRO DE ESTADO | 28 | R$ 23.007,40 |
10 | MINISTRO DE SEGUNDA CLASSE | 92 | R$ 21.803,78 |
12 | DELEGADO DE POLICIA CIVIL ESPECIAL | 16 | R$ 21.165,92 |
13 | DELEGADO DE POL FEDERAL CLASSE ESPECIAL | 400 | R$ 20.923,64 |
14 | TEC DE PLANEJ E PESQUISA-QUADRO SUPLEMEN | 15 | R$ 20.709,22 |
17 | PERITO CRIMINAL FEDERAL CLASSE ESPECIAL | 161 | R$ 20.121,84 |
19 | AUDITOR-FISCAL DA RECEITA FEDERAL BRASIL | 11556 | R$ 19.581,05 |
21 | CONSELHEIRO | 109 | R$ 19.460,44 |
24 | TECNICO DE PLANEJAMENTO | 70 | R$ 19.171,38 |
28 | AUDITOR FISCAL DO TRABALHO | 2992 | R$ 18.763,84 |
29 | ADVOGADO DA UNIAO | 1664 | R$ 18.648,99 |
32 | ANALISTA DO BANCO CENTRAL | 3604 | R$ 18.437,51 |
34 | PROCURADOR DO BANCO CENTRAL | 197 | R$ 18.286,05 |
35 | PROCURADOR FEDERAL | 4023 | R$ 18.126,87 |
37 | PROCURADOR DA FAZENDA | 1973 | R$ 18.096,88 |
38 | TECNICO DE PLANEJAMENTO E PESQUISA | 241 | R$ 17.943,75 |
Inclui uma coluna de “posição” porque eu tive de cortar um monte de cargos com poucas pessoas (uma ou duas na maioria das vezes) que não fazem muito sentido nesse contexto. Aí da pra ver que a galera do Banco Central ainda perde pra galera da Receita Federal, apesar de tar lá bem pertinho.
Uma coisa interessante de notar nessa tabela são os “ministros de estado”, que em princípio ganham o mesmo que o presidente da república ou o presidente do BC, mas que ali estão bem pra baixo. Fuçando um pouco a gente descobre que vários deles recebem R$ 0,00 pois atingem o teto com as remunerações originais deles (do legislativo ou de outras esferas de poder) que não aparecem na lista. E tem o Brizola Neto, que tomou posse durante o mês de maio e não recebeu o valor integral por isso.
Mas por enquanto é só fatos curiosos. Não tem nada de realmente interessante. Foi quando eu resolvi entrar pra numerologia e descobrir
Qual o significado do seu nome?
Pois é, quais nomes (ou sobrenomes) fazem as pessoas ganharem mais? Como eu fiz a tokenização dos nomes, dá pra agrupar por eles e descobrir. E aqui vai uma dica: se quiser que seu filho se dê bem no funcionalismo público, chame ele de Ricardo! (E nunca, mas nunca mesmo, chame sua filha de Camila). Na verdade, eu filtrei os 100 nomes mais comuns e peguei os maiores e menores salários médios entre eles:
Nome | Qtd | Média |
RICARDO | 3557 | R$ 8.334,13 |
EDUARDO | 3156 | R$ 8.187,19 |
MAURICIO | 1371 | R$ 8.119,83 |
MAURO | 1186 | R$ 8.109,96 |
SERGIO | 3523 | R$ 8.090,30 |
CELSO | 926 | R$ 8.034,11 |
MARCO | 1860 | R$ 7.983,56 |
ALEXANDRE | 2922 | R$ 7.977,80 |
MARIO | 1859 | R$ 7.976,97 |
FLAVIO | 1527 | R$ 7.942,51 |
Comparando com os nomes mais comuns, que ficam perto da média geral:
Nome | Qtd | Média |
MARIA | 31476 | R$ 6.324,43 |
JOSE | 23187 | R$ 6.740,67 |
ANTONIO | 10156 | R$ 6.789,10 |
ANA | 9116 | R$ 6.370,80 |
CARLOS | 8715 | R$ 7.432,78 |
PAULO | 8462 | R$ 7.608,24 |
JOAO | 8382 | R$ 6.782,20 |
LUIZ | 7963 | R$ 7.536,28 |
FRANCISCO | 7538 | R$ 6.403,44 |
MARCELO | 4283 | R$ 7.933,07 |
Dá pra se ver a importância de ser Ricardo! São quase R$ 2.000,00 a mais. E pra camila então, nem se fala:
Nome | Qtd | Média |
CAMILA | 761 | R$ 4.268,22 |
DIEGO | 682 | R$ 4.606,43 |
PRISCILA | 597 | R$ 4.743,88 |
RAIMUNDA | 602 | R$ 4.851,35 |
ALINE | 1288 | R$ 4.937,33 |
ANDREIA | 630 | R$ 5.044,09 |
VANESSA | 956 | R$ 5.080,88 |
THIAGO | 1245 | R$ 5.088,57 |
FRANCISCA | 1297 | R$ 5.152,34 |
THAIS | 501 | R$ 5.202,00 |
Um Ricardo vale quase o dobro de uma Camila!
(Eu não sei explicar esses fenômenos, mas a predominância masculina no topo e feminina na base dão uma idéia de que sexo deve ter influencia no salário. Outro fator que parece relevante é a época em que o nome esteve na moda. Ricardos tendem a ser mais velhos que Camilas, o que os coloca em patamares maiores nos planos de carreira. Ainda devem ter outros fatores extra-numerologia pra explicar, quem tiver palpites verificáveis, poste nos comentários)
E o que falta?
Bom, isso tudo foi diversão. Falta encontrar algo de sério nisso tudo. Pra isso eu queria fazer um data-mining mais sério nos dados, mas me falta experiência. Tentei montar um BI no pentaho com os dados, mas ainda estou apanhando pra modelar bem esses dados. Principalmente o fato de ter várias pessoas com mais de um cargo me deixa sem saber como isso se modela num DW.
Num data-mining “manual” andei descobrindo uns padrões interessantes: Quando agrupo as pessoas por órgão e por nome/sobrenome, encontro vários casos de pessoas que estão no mesmo órgão, tem o mesmo sobrenome, em geral uma mulher e um homem, ele com cargo de direção, ela com uma função comissionada de assessoramento, mas com um salário mais alto que a média. Sem uma verificação mais profunda, não posso afirmar nada, mas parece que: ou os diretores se apaixonam pelas assessoras mais bem graduadas, ou eles conseguem encaixar suas esposas nos melhores cargos de assessoramento dos órgãos onde trabalham. Conhecendo o serviço público, vou chutar que é a segunda opção!Similar Posts:
- Fuçando a transparencia, parte 2
- Fuçando a transparência no senado
- 2007 August 03 13:57:07 BRT
- Problemas com o Banco do Brasil
- 2007 September 05 23:14:11 BRT
How i met your mother
11 de Junho de 2011, 0:00 - sem comentários aindaCrianças,
No outono de 1999 o seu tio paulosta me chamou no mirc. Naquela época a internet era movida a vapor, a injeção eletrônica ainda era novidade e a piadinha de atender o chinelo toda vez que algum celular tocava ainda tinha graça. Era um tempo em que a internet parecia feita por torpedos de celular, só que sem celular, e o mirc era a segunda forma de comunicação mais utilizada na internet (a primeira era recadinhos em post-its pregados no monitor da pessoa). Pois bem, foi nesse ano que seu tio paulosta me chamou no mirc:
<paulosta> girino, tava mascano uma mulher aqui mas acho que ela eh proce.
[naquela época teclado acentuado também era novidade, quem dirá um programa que aceitasse acentuação]
<girino> porque?
<paulosta> ela eh bonitinha, mas eh baixinha e gordinha!
<girino> tem foto?
<paulosta> perai que jah mando!
-paulosta- DCC send ny.jpg
-girino- DCC file received 17 bytes/s
<paulosta> viu aih? eh essa anita que tah no canal!
Não sei bem se o diálogo foi exatamente esse, mas foi algo bem parecido com isso. Nesse ponto eu ainda não conheci sua mãe. Não. Primeiro porque, bem, naquela época medieval, a gente não tinha muito o costume de sair com a primeira pessoa que conversasse no mirc. Segundo porque ela fugiu pra Chicago e passou uns dois meses por lá… Conversando comigo todo dia, pelo mirc, claro! Num desses dias, a curiosidade dela falou mais forte:
<anita> girino, qual o seu nome?
<girino> girino mesmo, porque?
<anita> hummm
E ao mesmo tempo, outra janelinha pulava na minha tela:
<paulosta> a anita perguntou seu nome e eu falei que era julio cesar. finge que eh verdade.
<girino> hauhauhauahauhauahu [naquela época a gente ainda não ria “rss” ou “lol”, era hahaha ou huahauhua, acreditam nisso?]
De volta a janelinha da anita:
<anita> ah, eu descobri seu nome! eh Julio Cesar!
<girino> como vc descobriu? foi o paulosta que te contou?
<anita> claro que nao! eu descobri sozinha!
Desse dia em diante, eu era, pra todos os efeitos, Júlio César! (Menos mal, se já acreditaram quando eu disse que meu pai tinha morrido na guerra da Criméia e, no primeiro de abril de 2002, que eu faleci vítima de gripe asiática, eu chamar Júlio César era fácil).
Depois dessa lenga lenga toda, a galera do mirc, ou melhor, a galera que bebia comigo e com o paulosta e também frequentava o mirc por nossa causa, resolveu fazer um encontro no boliche do shopping Del Rey. A Anita tinha voltado de chicago e pela primeira vez eu a convenci a me encontrar: não estaríamos sozinhos, era perto da casa dela e no fim das contas, se tudo desse errado a gente poderia só jogar boliche!
Quer dizer, a parte do “não estaríamos sozinhos” não funcionava em favor dela: eu estaria com meus companheiros de farra, todos conspirando para que eu ficasse com ela. Mas ela não precisava saber! Até então, eu devia parecer um sujeito nerd romântico solitário que ela conheceu na internet. Que ilusão. Quando ela chegou, ela já foi logo se assustando, pensando (bom, ACHO que ela pensou isso, confirmem com ela depois):
“Meu Deus! Que povo bêbado sem noção. Que menino nojento! E ele nem faz a barba! Que horror! O quê que eu tou fazendo aqui?”
Mas com tudo planejado, e o “não estaríamos sozinhos” já funcionando, fomos pressionados num canto onde consegui um primeiro beijo sob vivas e aplausos. E sob olhar de desespero por parte dela, já pensando que não tinha como a coisa piorar, eu viro pra ela e falo:
- Ou, para de me chamar de Júlio César, sô! Meu nome é João!
Sete anos depois, nos casamos!
Se eu não tomei um tapa na cara nesse dia, acho que nunca mais vou tomar!
(Esse post foi escrito para o jornalzinho interno da empresa onde a Anita trabalha, em homenagem ao dia dos namorados de 2011).