Dashboard de Detección de Anomalías

Un análisis cuantitativo de la contratación pública en Yarumal Antioquia.

Si esta herramienta te parece útil, considera apoyarla.

Consultar un Contrato Específico

Error en la Búsqueda

No se pudo encontrar el contrato con ID: 07-2-33720

Top 50 Contratos con Mayor Score de Anomalía

ID Contrato Objeto del Contrato Tipo de Proceso Valor (COP) Score Total
No hay datos de anomalías para mostrar. Por favor, ejecuta el comando de análisis.

Metodología del Análisis

Este sistema evalúa contratos públicos para identificar anomalías estadísticas mediante un modelo híbrido que combina análisis financiero y textual. La fuente de datos es la API del portal de Datos Abiertos de Colombia, específicamente el dataset 4jvh-c3hj.

Un score de anomalía elevado no implica una irregularidad, sino que es un indicador de que las características de un contrato se desvían significativamente de la norma de su categoría, justificando una revisión más detallada. El proceso se desglosa en los siguientes componentes:

1. Componente de Anomalía Financiera (Score_Financiero)

Para cada tipo de contrato (ej. "licitación pública", "mínima cuantía"), se modela la "normalidad" del valor de los contratos. La anomalía se cuantifica calculando el Z-score, que mide cuántas desviaciones estándar se aleja un valor de la media de su grupo.

$Z = \frac{|x - \mu|}{\sigma}$
Donde:
  • x es el valor del contrato analizado.
  • μ es la media del valor de todos los contratos en la misma categoría.
  • σ es la desviación estándar de los valores en la misma categoría.

2. Componente de Anomalía Textual (Score_Textual)

Se analiza el campo "objeto del contrato" para encontrar términos que son inusualmente relevantes. Esto se logra mediante el algoritmo TF-IDF (Term Frequency-Inverse Document Frequency). Un término con un alto score TF-IDF es uno que aparece frecuentemente en un contrato específico (TF alto) pero es raro en el resto de los contratos de la misma categoría (IDF alto).

$TF-IDF(t, d, D) = TF(t, d) \times IDF(t, D)$
Donde:
  • $TF(t,d)$ es la frecuencia del término $t$ en el objeto del contrato $d$.
  • $IDF(t,D) = \log\frac{N}{|\{d \in D : t \in d\}|}$, siendo $N$ el número total de contratos.

El score de anomalía textual de un contrato se define como el máximo valor TF-IDF de cualquier término en su objeto.

3. Score de Anomalía Total (Ponderado y Normalizado)

Dado que el Z-score y el score TF-IDF operan en escalas diferentes, ambos se normalizan a un rango común de [0, 1] usando Min-Max Scaling. Posteriormente, se combinan en un score final mediante un promedio ponderado para reflejar la importancia relativa de cada componente.

$Score_{Total} = (w_{f} \cdot Score_{Fin, norm}) + (w_{t} \cdot Score_{Tex, norm})$
Con pesos asignados: $w_{f} = 0.6$ y $w_{t} = 0.4$.