Economía

Big Data

La ventaja de tratar a los parados como datos

Así se está fraguando la revolución de las políticas de empleo

pixabay

Cada uno de los 3.335.868 parados registrados a día de hoy en los servicios públicos de empleo quiere que el Gobierno le trate como a una persona, con nombres y apellidos, no como si fuera un número más. Siempre hay excepciones, pero seguramente la mayoría no quiere que su caso sea un mero trámite; necesita un poco de humanidad y ayuda para poder trabajar algún día y conseguir cuadrar las cuentas a final de mes sin necesidad de hacer demasiados cálculos.

El Gobierno, en cambio, ha optado por tomar un camino aparentemente opuesto: tratar a los desempleados como datos, variables en una ecuación, carne de algoritmo. Lo mismo con los trabajadores que están en activo. Pero esto, aunque parezca mentira, puede ser bueno, muy bueno.  Es el tratamiento masivo de información, es el Big Data.

La idea es sencilla, pero la aplicación no lo es tanto. El Ministerio de Empleo es a día de hoy una de las instancias públicas que mayor volumen de datos maneja en España, junto al Instituto Nacional de Estadística (INE), y eso abre un abanico de posibilidades a las políticas de empleo inimaginable hasta ahora: desde afinar las necesidades de formación de cada uno de los parados para lograr que encuentren un empleo, hasta detectar en qué medida el cobro de la prestación por desempleo es un desincentivo a la búsqueda o perseguir el fraude de aquellos que se cogen bajas injustificadas.

Solo la Tesorería General de la Seguridad Social (TGSS) procesa nada menos que 7.000 millones de registros al mes correspondientes a 1,5 millones de empresas y 18,6 millones de trabajadores. Y, como dijo el premio Nobel de Economía de 1991, Ronald Coase, “si torturas los datos el tiempo suficiente, te confesarán cualquier cosa”. La clave es cómo hacerlo.

La reinvención de las estadísticas

Hasta hace relativamente poco, en los primeros años de la crisis, las estadísticas mensuales de paro registrado ofrecían información sobre las posibilidades que tenían los desempleados de encontrar un empleo. Sin embargo, el departamento que hoy dirige Fátima Báñez acabó por suprimir esa información. A simple vista parecía un intento de no enseñar la realidad de un mercado laboral en el que el parado tenía muy pocas opciones de emplearse. Pero no era así. Lo cierto es que la estadística era del todo imperfecta, según admiten fuentes del servicio público de empleo (SEPE).

A la salida de la crisis, España sigue teniendo un problema enquistado que es el paro de larga duración (desempleados que llevan más de un año buscando trabajo) y que se reparte, sobre todo, entre jóvenes y mayores de 45 años a menudo con baja cualificación. Pero también hay muchos casos de sobrecualificación.

Uno de cada dos desempleados se encuentran en este dique seco, lo que significa que, toda vez que la recuperación económica ha ido drenando las listas de paro, queda un remanente de desempleados difícil de absorber y que necesita imperiosamente atención personalizada para encontrar formación o un puesto de trabajo adecuado a sus circunstancias.

Son estos los que Empleo calificaba como parados con muy poca empleabilidad en las antiguas estadísticas, de ahí la necesidad de retomarlas, pero buscando información fiable y, sobre todo, haciendo de ellas un buen punto de partida que permita diseñar políticas de empleo más eficaces. Ahí entra en juego el Big Data.

En las tripas del Ministerio de Empleo

Cuando se gestionan millones de expedientes la tarea es faraónica. Sin embargo, el Ministerio de Empleo lleva unos años embarcado en una renovación sin precedentes para tratar de asimilar toda esa información y, aplicando técnicas de análisis de datos, obtener resultados predictivos con los que saber con antelación qué le conviene a cada parado para poder encontrarle un empleo.

Para ello, ha recurrido a la Fundación de Estudios de Economía Aplicada (Fedea), el think tank de cabecera del Gobierno, que ha diseñado un modelo de análisis de datos que aparece detallado en el libro Perfilado estadístico: un método para diseñar políticas activas de empleo, de los economistas Florentino Ferlgueroso, José Ignacio García-Pérez y Sergi Jiménez-Martín.

Los autores definen este perfilado como una herramienta para detectar las posibilidades de vuelta al empleo de cada desempleado de forma personalizada. A partir de ahí, es posible clasificar y segmentar a los parados en grupos diferentes, cada uno con unas carencias comunes y un orden de prioridad, para luego identificar la intervención más adecuada en cada caso a partir de la experiencia acumulada.

De esta forma, las políticas activas de empleo pueden funcionar como el vademécum de un médico. Tras una observación de millones de casos, estos modelos pueden agrupar a los parados por categorías (perfilado) y pueden predecir qué efectos podría tener, por ejemplo, un curso de inglés en la empleabilidad de un parado. Dicho de otro modo, se puede saber de antemano si la ‘medicina’ aplicada sirve para curar su dolencia.

Para realizar estos perfilados, Fedea plantea un proceso de sistematización de datos que no solo tienen en cuenta la edad, el género o el nivel de educación de estas personas (algo que ya puede dar idea de unas primeras acciones a emprender, desde la formación por ejemplo). También contempla factores más difícilmente observables, como la motivación de los candidatos, su red social o su capacidad para resolver problemas, algo que puede observarse en entrevistas personales.  Y es ahí donde los parados dejan de ser números para convertirse en personas.

Un proyecto piloto

Fedea ya ha puesto en práctica este modelo a partir de datos facilitados por el servicio público que afectan a un 15% de los demandantes de empleo entre septiembre de 2014 y julio de 2015.  A partir de esas referencias se han calculado las probabilidades de salir del paro a los tres, seis o doce meses, antes de determinar dentro de estos grupos cuatro opciones de intervención: orientación profesional, colocación, formación o empleo subvencionado.

Una mujer entra en una oficia de empleo en busca de una oportunidad para salir del paro.

Los primeros resultados han arrojado, por ejemplo, que las mujeres mayores de 55 años tienen muy pocas probabilidades de encontrar un empleo. Primero, porque en general solo un 12,6% de ellas tienen opciones de volver a trabajar en un plazo de tres meses, pero también porque este porcentaje cae al 3,1% entre los 55 y los 64 años. Por lo tanto, se podría tratar de un colectivo prioritario, al que se puede examinar con más detalle para ver qué carencias tiene y los resultados de las intervenciones previas.

Por  otro lado, el modelo predictivo de Fedea concluye también que el cobro de una prestación es un factor clave para no salir del paro en el corto plazo o que los empleados en la construcción o en la agricultura son los mejor posicionados.

Algunas barreras

La implantación de los perfilados se antoja complicada, pero no imposible. Es evidente que tras su aplicación existen trabas que provienen de las políticas de protección de datos, pero también de la propia mecánica de las oficinas de empleo. Ya en el citado libro se advierte de que "el personal de las oficinas de empleo tiende a oponerse, con mayor o menor fundamento, a la generalización en el uso de estos instrumentos".

"El perfilado debe estar diseñado para ser una herramienta que asista y ayude a los orientadores de empleo sin que ello implique reemplazarlos", señala de cara a implantar estos nuevos procedimientos en el SEPE, que ha visto reducido su presupuesto en un tercio y su plantilla en un 3% desde 2012, como incluso ha criticado la Comisión Europea.

Y es que, en el caso de las entrevistas personales, por ejemplo, será necesaria la colaboración de los trabajadores de las delegaciones del SEPE para poder nutrir las bases de datos con nueva información y eso llevará su tiempo.

Esta revolución interna en el Ministerio de Empleo ha llevado al departamento que dirige Fátima Báñez a crear una Dirección General de Estadística y Análisis Sociolaboral, ante la necesidad de integrar en un solo órgano directivo toda la extensa y compleja actividad estadística que gestiona el ministerio y que en la actualidad se encuentra dispersa en diversas unidades y organismos del departamento. A partir de ahí, el Ministerio de Empleo está en fase de acuerdo con una consultora externa que será la que desarrolle la herramienta de los perfilados en un plazo de entre seis y nueve meses.

El Big Data aplicado a la Seguridad Social

Pero el Big Data no solo sirve para mejorar la gestión del paro, sino también del empleo. La Seguridad Social también se ha dotado de herramientas tecnológicas de última generación para el tratamiento y análisis de datos. En esta ámbito se trata, sobre todo, de detectar del fraude con la supervisión de analistas que definen patrones de comportamiento y establecen, otra vez, modelos predictivos.

Esta nueva forma de trabajar aporta lo que se conoce a nivel interino en la Seguridad Social como alertas de riesgo, que avisan de situaciones irregulares y permiten, no solo su detección y corrección, una vez compartidas con la Inspección de Trabajo, Delincuencia Económica y Fiscal o el Servicio Jurídico de la Seguridad Social, sino también su prevención a futuro.

Como resultado, la Tesorería ha logrado grandes avances fundamentalmente en la detección de tres tipos de fraude: las empresas ficticias sin actividad real, el alta de empleados inexitentes en empresas con actividad y el registro de autónomos también ficticios.

Pues bien, estas herramientas han permitido aflorar casos de fraude en 12.170 empresas, que afectan a 104.347 trabajadores.

Además, gracias al Big Data se puede a día de hoy saber cuándo una persona o una empresa que pide un aplazamiento de sus pagos a la Seguridad Social no los va a pagar. Esto se consigue gracias a técnicas de inteligencia artificial. Se trata de un algoritmo que ha aprendido de más de 300 variables, entre fuentes de información internas y externas, y que permite concluir que quien ha incumplido antes volverá a hacerlo.  Del mismo modo, la Seguridad Social puede clasificar a los morosos por tipo de deuda, su solvencia y las posibilidades de cobro.

Por último, otro campo de la actividad de la Seguridad Social en el que el análisis de datos se está haciendo cada vez más decisivo es el control de las bajas laborales. Por ejemplo, el Instituto Nacional de la Seguridad Social (INSS) está a día de hoy capacitado, gracias a la coordinación con la Gerencia Informática de la propia Seguridad Social, para evitar citar a aquellos casos de incapacidad temporal que están bien justificados y que no requieren, por tanto, ser llamados a reconocimiento médico con anterioridad a los 365 días.

Todas estas herramientas funcionan de la misma manera: extraen patrones de comportamiento a partir de una sólida base matemático-estadística, para después poder actuar con mayor eficacia. Y no solo eso, toda infraestructura tecnológica y de datos está en constante revisión y adaptación para adelantarse a los cambios de comportamiento de los defraudadores.

"Los datos que maneja Empleo son oro", según admiten en el propio ministerio, que ahora, más que nunca, está en disposición de tratar a los parados y a los trabajadores como personas, pero a partir de los datos.

Te puede interesar

Salir de la versión móvil