Skip to content

Analizando + Limpiando datos de contratacion publica - Colombia

Notifications You must be signed in to change notification settings

OpenDataCo/AnalisisContratos

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Analisis Contratos

Analizando + Limpiando datos de contratacion publica.

  1. Datos generados con: https://github.com/dav009/contra
  2. Descargar dataset via torrent
  3. Descargar dataset via datahub

Limpieza

  1. Limpiar Campos:

    • Transformar campos a snake case
    • Unificar campos con nombres diferentes?. i.e: Nombre ó Razón Social del proponente seleccionado y Nombre o Razón Social del Contratista
    • Formatear fechas a un formato consumible. i.e: "24 de June de 2015 10:50 A.M."
    • Formatear locaciones .i.e: Departamento Y Municipio de Ejecucion: "Huila : La Plata" => departamento:"huila", "municipio":"la plata"
    • Formatear montos. i.e: $12,000,000 Peso Colombiano => 12000000
    • Formatear el campo Calificación definitiva de los proponentes - Orden de elegibilidad para extraer los proponentes, y el puntaje.

    Script de limpieza

    1. cleaning/clean.py es un script de limpieza
    2. uso: python3.4 cleaning/clean.py --input path/to/dataset.json --output path/to/shiny_clean_dataset.json

Analisis

Algunas:

  • Quienes obtienen mas contratos?
  • Quienes obtuvieron contratos siempre que fueron oferentes?
  • Contrataciones con- oferentes unicos?
  • Anomalias en duracion de convocatorias
  • Companias fantasmas ( sin mucha informacion en internet) (i.e: fundaciones sin mucho PR con 2/3 contratos gigantes)

Estructura

Limpieza

Contiene los scripts para transformar el dataset inicial en un dataset normalizado

Analisis

Contiene los scripts para analisis:

playground.R contiene un script juguete que usa sparkR para procesar el dataset y plotear los montos totales y numero de contratos para los contratantes que son fundaciones.

more R magic..

Test

to run test form the root folder run this command python -m unittest discover specs/test/cleaning/

About

Analizando + Limpiando datos de contratacion publica - Colombia

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •