Generan una base de datos accesible sobre las declaraciones patrimoniales de los funcionaros públicos

||En 2017, menos del 20% de los funcionarios que hizo una declaración patrimonial por inicio del cargo reportó algún ingreso

|Por Okupo+|

La organización Data Cívica publicó un portal para conocer información sobre los servidores públicos. En concreto, construyó una base de datos abierta con toda la información de sus declaraciones patrimoniales.

Si bien los funcionarios públicos están obligados por Ley a presentar su declaración patrimonial y de conflicto de interés, y que a su vez sea información pública, consultar, comparar y contrastar dichas declaraciones entre funcionarios, dependencias o años es prácticamente un proceso imposible.

¿Qué hicieron?

Usando el listado de los nombres de funcionarios públicos que presentaron declaraciones desde el primer semestre de 2013 hasta el segundo semestre de 2017, información pública, hicieron miles de consultas sistematizadas a Declaranet, una plataforma en línea de la Secretaría de la Función Pública, para primero, descargar uno a uno todos los documentos en formato PDF de las declaraciones de todos los funcionarios y después traducir la información que está contenida ahí en una gran base de datos abierta, que las personas pueden descargar y manipular.

Así fue cómo lo hicieron:

Luego de generar una lista con todos los nombres de funcionarios que trabajaron en el lapso ya mencionado, realizaron miles de consultas automatizadas a Declaranet, nombre por nombre, para descargar todos los archivos en PDF de todas las declaraciones de todos los funcionarios enlistados.

Este segundo paso resultó en la descarga de más de 2 millones 600 mil declaraciones de cerca de 400 mil funcionarios en más de 2 mil dependencias.

En el portal, explican que su tercer paso fue la extracción de la información contenida en los PDFs y su transformación en una base de datos en formato abierto. Para ello, usaron patrones en los archivos, como el orden de las tablas, la repetición de títulos, subtítulos y campos, además de la información contenida en los metadatos de los PDFs. Pudieron identificar qué información correspondía a cada tabla de cada declaración y la exportaron como base de datos en formato de CSV. Esto implicó que para cada PDF descargado generaron un CSV con la misma información.

+Al final, quedó la página 1560000.org

Escribe el primer comentario

Responder

Tu dirección de correo electrónico no será publicada.


*