Minería de datos del servicio civil chileno

Proyecto finalizado financiado por la Universidad de Santiago de Chile y apoyado por Training Data Lab

Las fuentes originales de información corresponden a datos liberados por la DNSC en respuesta a las solicitudes AE004T0000240 y AE004T0000484 en el marco de la Ley 20.285 sobre Acceso a la Información Pública, realizadas el 26 de diciembre de 2016 y el 26 de abril de 2018, respectivamente. Con la primera solicitud elaboramos una base de datos de altos directivos públicos para el período 2009-2015 (N = 391, véase también González-Bustamante, 2020).

Con esta base de datos y la segunda solicitud elaboramos un listado de 452 directivos del primer nivel jerárquico para el período 2009-2017. Posteriormente, recopilamos 1.396 documentos públicos, entre decretos de nombramiento, actas de los concursos, noticias institucionales, entre otros similares.

Los documentos fueron cargados en la plataforma Open Science Framework (OSF) y se les asignó una URL permanente única que nos permitió aplicar un algoritmo de reconocimiento óptico (OCR) programado específicamente para este propósito. De esta forma, los documentos PDF fueron convertidos en imágenes PNG que fueron cargadas en el repositorio del proyecto en GitHub que está conectado con OSF (surv-civil-servants, actualmente privado y pronto disponible para consulta pública).

Las imágenes se convirtieron a un formato de texto manejable a través del proceso previamente descrito con el fin de emparejar y verificar los documentos con los casos identificados. Esto nos permitió validar los casos.

Recursos

¿Cómo citar esta base de datos?

Última actualización: 6 de julio de 2023.

Bastián González-Bustamante
Bastián González-Bustamante
Investigador Postdoctoral

Investigador postdoctoral en Ciencias Sociales Computacionales y docente de Gobernanza y Desarrollo en el Instituto de Administración Pública de la Facultad de Gobernanza y Asuntos Globales de la Universidad de Leiden, Países Bajos. Profesor de la Escuela de Administración Pública de la Universidad Diego Portales e Investigador Asociado en Training Data Lab, Chile.

Siguiente