Se propone un marco adoptable por cualquier país de América Latina, organizado en cuatro capas integradas: una capa de medición censal de bajo riesgo entre 6.° y 11.° grado en el sistema público; una capa de bienestar con comedor escolar universal y transferencia condicionada a asistencia; una capa de intervención escalonada con verificación causal mediante pilotos aleatorizados; y una capa de oportunidad con un único examen de alto riesgo en 11.° grado destinado a becas amplias por progreso, contexto y necesidad. El diseño descansa sobre una regla operativa única —el dinero solo toca insumos baratos de verificar, nunca el termómetro— y excluye explícitamente los mecanismos de financiamiento por desempeño escolar e incentivos individuales sobre puntajes, por las razones técnicas que se desarrollan. La viabilidad fiscal cierra en 0,2–0,3 % del PIB para países con programas alimentarios y transferencias condicionadas existentes (la mayoría de la región), y 0,10–0,15 % del PIB para el sistema puro de medición, intervención y becas. El caso argentino se costea en USD 2.900 millones anuales (0,43 % del PIB), menos que el gasto vigente de la AUH.
Palabras clave: evaluación educativa, transferencias condicionadas, política educativa comparada, América Latina, financiamiento educativo, AUH, alimentación escolar, intervención escolar, becas estudiantiles.
Los sistemas educativos de América Latina enfrentan tres fracasos persistentes que conviene nombrar con precisión, porque cada uno admite un instrumento distinto y combinarlos en un solo dispositivo —como han intentado reformas anteriores— ha producido efectos contraproducentes.
Primero, un fracaso de información: los ministerios no saben, con datos limpios y comparables, qué escuelas están enseñando bien y cuáles no. Los datos que existen son autoreportados por las propias escuelas o vienen de pruebas estandarizadas con stakes que distorsionan la medición. Sin diagnóstico confiable no hay política de mejora posible.
Segundo, un fracaso de bienestar: una proporción significativa de los estudiantes asiste a clase con hambre, y otra parte directamente no asiste porque su familia necesita el ingreso de su trabajo. Ninguna pedagogía resuelve estos dos problemas; sin embargo, ambos tienen instrumentos probados de política social (comedores escolares y transferencias condicionadas) con décadas de evaluación rigurosa.
Tercero, un fracaso de intervención: incluso cuando el sistema sabe que una escuela falla, los mecanismos para ayudarla son lentos, opacos, mal coordinados con las instancias subnacionales de gobierno y carentes de evidencia causal sobre qué intervenciones funcionan.
Las reformas latinoamericanas de las últimas tres décadas han ofrecido respuestas conocidas: financiamiento por desempeño, evaluaciones docentes con consecuencias salariales, premios y castigos sobre puntajes. La evidencia comparada sobre estos mecanismos es, en el mejor caso, ambigua, y en varios casos documentados francamente negativa: aumento del fraude estadístico, vaciamiento curricular hacia las materias evaluadas, push-out de estudiantes con bajo rendimiento, y desmoralización docente. Este marco se construye explícitamente para evitar ese conjunto de patologías.
Toda la arquitectura descansa sobre una restricción única, derivada de la literatura sobre incentivos en medición de desempeño (Campbell, 1979; Muller, 2018) y verificada en la experiencia comparada:
El mismo instrumento no puede medir limpio y repartir recompensas a la vez. Cuando una métrica se convierte en objetivo de dinero o consecuencias, deja de ser una buena métrica: el esfuerzo se redirige a inflar el número, no a producir lo que el número intentaba medir.
De allí se deriva la regla operativa que ordena dónde puede haber dinero en el sistema:
El dinero solo toca lo que es barato de verificar y no es el termómetro. Se pagan insumos verificables (asistencia, permanencia, alimentación). Los resultados se premian una sola vez, al final de la trayectoria, en un único instrumento blindado para soportar ese peso.
Esta regla excluye, por construcción, los siguientes mecanismos: financiamiento escolar atado a puntajes; bonificaciones docentes por resultados de sus alumnos; premios individuales por mejora año a año; rankings públicos ordinales de escuelas; promoción de grado automatizada por examen externo. Cada uno de estos mecanismos fue considerado y descartado por razones que se desarrollan en las secciones correspondientes.
El marco define funciones, no instituciones específicas. Cada país las encarna en sus propios órganos mediante un anexo de implementación local (en Argentina las jurisdicciones provinciales actúan como Autoridad Responsable; en Chile los servicios locales de educación; en Colombia las secretarías de educación certificadas; y así sucesivamente).
Sin estas funciones el modelo no opera, en ningún país. La presencia de las cinco condiciones constituye el piso mínimo de adoptabilidad:
Alcance: el sistema cubre exclusivamente la educación pública. El objetivo declarado es que la escuela pública mejore hasta volverse más atractiva que la privada; el motor de esa mejora es autorreferencial —cada escuela contra su propia trayectoria y sus comparables— y no requiere medir al sector privado.
Una vez al año, los grados 6.° a 10.° del sistema público rinden un examen nacional estandarizado sobre una currícula común, en todas las materias obligatorias. El examen es deliberadamente de bajo riesgo: no afecta la promoción, no reparte premios, no altera presupuestos. El estudiante opera como sensor del sistema, no como concursante —y precisamente por eso el dato puede salir limpio.
La cobertura combina dos modalidades. En las escuelas con baja matrícula se aplica censo completo (es trivial de administrar y elimina el ruido muestral). En las escuelas grandes se toma una muestra estratificada por nivel de desempeño previo (bajo / medio / alto), clasificada con el examen limpio del año anterior y nunca con notas escolares. Esta estratificación tiene una propiedad central: inflar las notas de un alumno débil para reclasificarlo en el estrato alto lo coloca en un grupo donde rendirá mal en el examen limpio y hundirá ese estrato; el fraude se autodelata estadísticamente.
La generación de los instrumentos se delega a un proveedor externo bajo un esquema con cuatro defensas operativas: banco de ítems con autores en silos (que no se conocen entre sí), banco en custodia técnica (escrow), rotación periódica del proveedor para impedir su captura, y separación física y procedimental entre quienes construyen los ítems y quienes acceden al banco final. La seguridad en 6.° a 10.° es deliberadamente liviana: sin stakes, el incentivo a robar un examen es bajo y no justifica los costos de una fortaleza.
La objeción técnica más importante a una medición sin consecuencias es que una fracción de los estudiantes no se esforzará, sesgando el diagnóstico. El marco la enfrenta con tres mecanismos combinados: exámenes cortos para minimizar fatiga; encuadre motivacional apropiado a la edad sin amenazas de consecuencias; y filtros estadísticos posteriores que detectan y descartan patrones de respuesta al azar. La evidencia internacional (NAEP, PISA) muestra que con estos mecanismos el sesgo de esfuerzo es manejable y no compromete las inferencias a nivel de escuela y sistema.
Si la evidencia de los primeros años indica que el problema es mayor del previsto, existe un upgrade definido: que el resultado del examen cuente como una nota más dentro de la calificación de la materia (peso acotado; la escuela conserva su autoridad de promoción con todas sus instancias). Este upgrade conlleva un costo —pasar de muestra a censo total en las escuelas grandes— y se activa solo si la calidad del dato lo requiere.
El padrón nominal permite seguir la trayectoria de cada alumno entre 6.° y 11.°, incluyendo cambios de escuela: el registro persigue al estudiante, no la inversa. La deserción y la depuración anómala de matrícula —que es la palanca de fraude más difícil de eliminar en sistemas con cualquier tipo de stakes— disparan banderas rojas automáticas. Ninguna escuela puede mejorar sus números empujando afuera a alumnos débiles, porque esos alumnos no desaparecen del sistema: son rastreados a su nueva escuela o, si no aparecen en ninguna, marcados como deserción que debe explicarse.
Los exámenes mensuales y las notas escolares siguen siendo de la escuela: herramienta formativa del docente, jamás insumo de dinero ni rankings. La brecha entre lo autoreportado por la escuela y lo medido por el examen anual limpio funciona como detector gratuito de inflación de notas a nivel de curso —sin auditar ningún examen mensual, el sistema obtiene una señal de integridad—.
Las encuestas anónimas de alumnos sobre sus docentes (trimestrales y de fin de año) son insumo formativo sin premio ni castigo: bien diseñadas, predicen calidad docente mejor que los modelos de valor agregado solos, pero pierden esa propiedad si se les agrega stakes (sesgo de complacencia, premio al docente fácil, castigo al exigente).
La evaluación docente es formativa, multi-fuente y de bajo riesgo —observación, pares, encuesta estudiantil, progreso de alumnos como un insumo entre varios— orientada a apoyar y desarrollar al docente, nunca a rankearlo o despedirlo. Esta es una decisión técnica con respaldo: los esquemas de evaluación docente de alto riesgo basados en valor agregado son ruidosos al punto de la injusticia (mismo docente, quintiles distintos en años consecutivos por azar) y trasladan al docente individual toda la presión de gaming, lo que explica buena parte de los escándalos de fraude educativo de las últimas dos décadas. Adicionalmente, la competencia entre docentes destruye la colaboración que la transferencia de buenas prácticas requiere.
La promoción permanece como decisión de la escuela, integrando todo el año, con sus instancias múltiples (recuperatorios, mesas) y el juicio de los docentes que conocen al alumno. El examen nacional nunca decide automáticamente la promoción individual de un estudiante. Esta separación es técnicamente necesaria: un examen diagnóstico se diseña con ítems de todo el rango de dificultad para mapear la distribución completa; un examen de promoción exige precisión psicométrica alrededor de la línea de corte, estándares defendibles individualmente y apelabilidad legal. Son artefactos distintos y un solo instrumento no puede optimizar ambos.
La pregunta operativa obvia ante un sistema con dos exámenes nacionales (6.° a 10.° de bajo riesgo, 11.° de alto riesgo) es cómo se administran físicamente. La respuesta debe ser distinta para cada uno, y esa asimetría es la decisión de diseño que hace al modelo fiscalmente viable a la vez que íntegro. Aplicar el mismo aparato logístico a ambos —como propone, por ejemplo, replicar el protocolo del ICFES colombiano en todos los grados— multiplicaría el costo operativo sin agregar protección útil, dado que en 6.° a 10.° no existe un incentivo serio para falsear un examen sin consecuencias.
Examen de 6.° a 10.° (bajo riesgo). Una sola fecha nacional simultánea por ciclo lectivo. Se rinde en la propia escuela del alumno, supervisado por docentes rotados entre aulas de la misma institución (un docente de un grado supervisa el examen de otro grado, nunca el propio). Forma común para todo el país en cada grado, lo que preserva la comparabilidad nacional sin la complicación psicométrica de equiparar múltiples formas. La seguridad es deliberadamente liviana: sin stakes ni para el alumno ni para la escuela, el incentivo a la copia o la adulteración es marginal, y los pocos casos remanentes son capturados ex post por las defensas estructurales del sistema (estratificación autocorrectiva, brecha entre autoreporte escolar y examen limpio, función auditora del examen de 11.° sobre la trayectoria). No se trasladan menores a sedes ajenas, no se requieren jurados externos, y la pérdida de día de clase se limita a una jornada por grado por año.
Examen de 11.° (alto riesgo). Aplica el protocolo completo descripto en la sección 6: sede ajena a la escuela del alumno (modelo análogo al ICFES en Colombia, al ENEM en Brasil o a la PAES en Chile), jurados ciudadanos sorteados —no docentes, dado que los docentes son parte del sistema medido y los ciudadanos no—, formas isomorfas equiparadas estadísticamente por turno, secreto operativo del banco de ítems, infraestructura de control. Una sola fecha nacional con recuperatorio acotado para casos justificados, aplicando una forma alternativa equiparada. Aquí la fortaleza completa se justifica porque el examen reparte becas: el incentivo de gaming es real y el costo de la protección está acotado a un solo evento anual con una sola cohorte (~5–10 % de la matrícula del sistema).
La razón profunda de esta asimetría es la misma regla operativa del sistema: la protección se aplica donde existe el incentivo a la trampa, no como una propiedad uniforme del aparato de medición. En los grados sin stakes, mover a millones de menores a sedes ajenas, dos veces por año, con jurados externos, sería una imitación cosmética del aparato del examen serio: produciría la apariencia de rigor sin la sustancia, multiplicaría el presupuesto logístico por un orden de magnitud y agregaría una percepción de alto riesgo que contaminaría el dato que precisamente se busca obtener limpio.
Toda escuela pública del sistema cuenta con comedor. Todos los estudiantes almuerzan mediante la tarjeta estudiantil, sin uso de efectivo en las cajas de los comedores. Este detalle operativo es central: la literatura sobre estigma en comedores escolares es unánime en que cuando el método de pago señala públicamente quién es subsidiado, los estudiantes que más lo necesitan dejan de usar el servicio. Una sola interfaz (tarjeta universal), con diferencia en quién carga los créditos (Estado para los beneficiarios, familias que opten por contribuir desde casa, nunca en la fila) elimina el problema sin costo adicional.
Los créditos se renuevan mensualmente y no se acumulan, lo que evita atesoramiento, mercado secundario de créditos y desvinculación del beneficio de su propósito inmediato. La evidencia regional sobre alimentación escolar (asistencia, cognición, equidad) es de las más sólidas en política educativa.
Una transferencia mensual (referencia: USD 50 por estudiante en el caso argentino) pagada al adulto registrado del estudiante, condicionada al cumplimiento de un umbral de asistencia (80–85 %) con faltas justificadas excluidas. El diseño con umbral, contra el diseño binario de «asistencia perfecta», elimina el incentivo a enviar a clase a un menor enfermo: el chico falta con certificado y la familia no pierde el beneficio.
El instrumento es el que mayor evidencia tiene en política social latinoamericana: las transferencias condicionadas (Progresa/Oportunidades en México, Bolsa Família en Brasil, Asignación Universal por Hijo en Argentina, Familias en Acción en Colombia) han mostrado consistentemente, en décadas de evaluación, efectos positivos sobre matrícula y asistencia y reducción del trabajo infantil. El marco no propone reinventar el instrumento: propone integrarlo cuando ya existe, y crearlo cuando no.
La focalización opera por escuela, no por familia, usando los estratos socioeconómicos que el sistema construye con datos territoriales censales. Esta elección responde a una restricción regional: el examen socioeconómico individual choca con la informalidad (los ingresos no registrados producen falsos negativos crueles, y la informalidad incentiva ocultamiento). La focalización por escuela traslada la clasificación a un nivel agregado, inmanipulable por la institución, sin examen de medios individual y sin estigma intra-escolar. Las fugas (estudiantes de familia acomodada en escuela pobre que cobran, estudiantes pobres en escuela acomodada que no cobran por esta vía) son tolerables y se cubren por la vía individual del programa nacional existente.
Token físico del padrón nominal que unifica el sistema: identidad, marca de asistencia, acceso al comedor y canal de beneficios. La verificación de asistencia opera en tres señales independientes: la marca en el lector de entrada (señal primaria, sin trabajo docente, con funcionamiento offline y sincronización diferida); la lista en papel que el docente ya está obligado por ley a tomar (auditada por muestreo aleatorio contra las marcas de tarjeta; las discrepancias generan banderas automáticas); y la marca del comedor (tercera señal). El umbral mensual del 80 % tolera el ruido operativo diario sin necesidad de precisión quirúrgica.
Al final de la secundaria, el único examen de alto riesgo del sistema: censal, individual, en formato de «competencia con uno mismo» contra un estándar absoluto, no contra otras escuelas. Administrado fuera de la institución educativa, en ambiente controlado, con la fortaleza de seguridad completa: formas isomorfas equiparadas estadísticamente por turno, secreto del banco de ítems, infraestructura logística dedicada.
La custodia del proceso opera con un modelo electoral adaptado: grupos de 4 a 5 jurados ciudadanos sorteados por sede, de la misma provincia pero con residencia en sectores distintos (para reducir colusión y conflicto de interés local), más un empleado estatal por grupo. Los jurados reciben un viático plano (USD 50 por jornada más comida en sede) y custodian el proceso: apertura sellada del examen, ausencia de interferencia docente o institucional, recolección íntegra. La corrección la realiza una máquina sobre hojas de opción múltiple; el humano agrega superficie de fraude y error en la tarea de calificación, y se retira de ella. Los resultados anonimizados se publican para que cualquier ciudadano pueda hacer recuento.
El puntaje de 11.° reparte becas, no admisión universitaria. Esta es una decisión deliberada con dos fundamentos. Primero, los exámenes-puerta excluyen sistemáticamente a las promesas tardías y a las inteligencias que no caben en una prueba estandarizada: la literatura sobre validez predictiva del examen único es modesta, y los falsos negativos tienen costos sociales irreversibles. Segundo, condicionar la admisión universitaria a un examen secundario interfiere con la autonomía universitaria que rige en buena parte de la región y multiplica las negociaciones políticas necesarias para adoptar el marco.
La beca se calcula sobre progreso (cuánto avanzó el estudiante en su trayectoria 6.°–11.°), contexto agregado (estrato de la escuela y región, nunca los puntajes individuales del estudiante en los grados bajos, para no contaminarlos con stakes) y necesidad socioeconómica. La beca es deliberadamente ancha: muchos estudiantes tienen chance real de obtenerla, lo que sostiene la motivación de toda la cohorte y no solo de los top performers. Esta amplitud es también la respuesta al problema del esfuerzo descripto en 4.2: el examen de 11.° gana en seriedad si una mayoría de los estudiantes percibe que el resultado puede mejorarles la vida.
El uso de la beca es libre y el pago se devenga en cuotas mensuales o trimestrales durante 2 a 3 años (esquema análogo al vesting de equity en el sector privado). Esto cumple tres funciones simultáneas: evita el problema operacional de un monto grande recibido a los 18 años, distribuye el costo fiscal en varios ejercicios, y convierte el destino que los egresados den a la beca en un sensor del sistema —si una mayoría no usa la beca para continuar estudios, eso indica falencias en la articulación entre secundaria y educación superior que la propuesta no tendría cómo conocer de otra forma—. La condición está en ganar la beca, no en gastarla: es el pago de un contrato (seis años de cursada con progreso medido limpio), no un subsidio condicionado al uso.
La intervención es la razón de ser del sistema: medir → diagnosticar → intervenir. Un termómetro sin tratamiento solo confirma que el enfermo está enfermo. Esta capa es la que distingue una reforma del marco propuesto de un mero sistema de evaluación.
Una escuela ingresa al circuito de fortalecimiento cuando se cumplen tres condiciones simultáneamente: rendimiento significativamente por debajo de sus comparables dentro de estrato (no por debajo del promedio general, dado que por aritmética la mitad de las escuelas siempre está bajo el promedio); medición en progreso y no en nivel absoluto (que mide preponderantemente nivel socioeconómico del entorno, no calidad educativa); y persistencia (2 a 3 años consecutivos), para excluir la varianza de un mal año puntual.
La comparación opera dentro de estratos definidos por contexto socioeconómico, ubicación y tamaño, con clasificación pública, estable e inmanipulable por la escuela (construida con datos censales territoriales externos). El mismo gatillo aplica quirúrgicamente a una materia o grado específico dentro de una escuela que en general funciona bien, lo que permite intervenciones acotadas y baratas.
Disparado el gatillo, se diagnostica el tipo de problema —pedagógico, de infraestructura, geográfico o social— porque cada tipo exige un tratamiento distinto. A un problema de infraestructura no se le envía un consultor pedagógico, y a un problema pedagógico no se le ofrece equipamiento.
La intervención opera en cuatro niveles secuenciales:
Nivel 0 — Alerta temprana. Primer año bajo umbral: aviso privado a la escuela y su Autoridad Responsable; autoevaluación guiada; acceso voluntario al menú de proveedores de mejora. Sin etiqueta ni registro público.
Nivel 1 — Apoyo elegido. Confirmado el gatillo formal (2–3 años persistentes), la escuela elige proveedor de fortalecimiento de un menú acreditado (universidades, redes de escuelas, programas certificados) con fondos marcados del Fondo y plan de metas medibles en progreso. Duración: dos años.
Nivel 2 — Plan condicionado. Si tras el Nivel 1 no hay mejora, la Autoridad Responsable co-firma un plan vinculante; revisión de gestión y liderazgo; administración conjunta AR–CI; la AR queda expuesta en los agregados públicos con nombre (la presión sube por la cadena hacia el gobierno responsable, nunca baja a la escuela). Duración: dos años.
Nivel 3 — Intervención directa. Falla grave y persistente (típicamente 4–5 años acumulados, o casos agudos). El Cuerpo de Intervención asume co-gestión temporal —dirección de apoyo y refuerzo docente—, con criterios de salida definidos ex ante (retorno sostenido a la banda de comparables durante dos años). Cierre o consolidación: nunca, bajo ninguna circunstancia. El cortafuegos es absoluto y protege especialmente a la escuela rural, cuyo rol comunitario excede su puntaje.
La decisión de escalar entre niveles la toma un comité técnico (AM + CI + representante de la AR) por resolución motivada y públicamente registrada, auditable contra la doble vara política. La AM certifica el dato; el gatillo es objetivo, no opinable. Cada caso se revisa anualmente.
Tres mecanismos previenen el espiral de muerte conocido (la escuela diagnosticada pierde alumnos y docentes antes de que la ayuda llegue): sin etiquetas públicas (el informe en bandas de la escuela no muestra su estado de intervención; el programa se denomina «fortalecimiento», no «intervención»); participar en pilotos se enmarca como acceso temprano a prácticas probadas, no como castigo; y bono de permanencia para los docentes de escuelas en Niveles 2–3 —pago por insumo barato de verificar (quedarse), legítimo bajo la regla operativa del sistema, que frena la fuga de los buenos docentes en el momento en que la escuela más los necesita—.
Las buenas prácticas no se fotocopian del ranking: las escuelas que aparecen como «top» suelen serlo por la selección de su alumnado, no por un método replicable. El proceso correcto opera así: identificar outliers positivos en progreso dentro de su estrato (escuelas que avanzan más de lo esperable con población difícil —esas sí tienen algo que vale la pena estudiar—); aislar la práctica mediante estudio cualitativo; pilotearla con asignación aleatoria entre escuelas voluntarias. La invitación es voluntaria; el sorteo, entre las que aceptan, decide quién la recibe en la primera tanda y quién en la siguiente. La comparación voluntaria-con vs voluntaria-en-espera es causalmente limpia, preserva la voluntariedad de las escuelas, y convierte la transferencia de prácticas en evidencia causal antes de escalar a costo nacional. Con efecto probado en piloto, la práctica escala; sin efecto, se descarta con evidencia y el proveedor pierde acreditación si reincide.
El principio rector de la publicación es que los stakes suben por la cadena de gobierno. La presión reputacional recae sobre las jurisdicciones responsables, que tienen poder y recursos para arreglar, y nunca baja hacia escuelas individuales y estudiantes.
Cada familia accede al informe de su propia escuela —autenticada contra el padrón en el portal de la AM, o por informe impreso en la asamblea anual obligatoria donde no hay conectividad—. El informe contiene bandas relativas a sus comparables («por encima / en línea / por debajo, en progreso»), evolución propia y desempeño por área gruesa. Ningún documento público contiene puntajes crudos: las bandas son relativas a estratos distintos y no son conmensurables entre sí, de modo que el ranking nacional no puede reconstruirse ni juntando todos los informes del país. La protección opera por diseño del artefacto, no por control de acceso. El secreto estadístico (figura legal preexistente en la región) respalda la frontera: la AM tiene prohibido liberar el dato granular identificado.
Los agregados por provincia y estrato sí son públicos, con nombre. Las jurisdicciones se comparan entre sí públicamente.
Tres mecanismos previenen la captura política del dato: la AM independiente es dueña del dato y publica por calendario fijo y automático (ningún ministro puede demorar ni vetar una publicación); microdatos anonimizados son accesibles a investigadores acreditados (sistema inmune externo, que detecta lo que el sistema oficial no querría ver); y toda decisión de intervención es motivada y registrada, auditable contra la doble vara política.
El objetivo realista no es eliminar el fraude —es hacerlo caro, detectable y poco rentable, y sobre todo sacar el instrumento de medición de las manos de quien tendría incentivo a falsearlo—. Las defensas operan por diseño:
Las penas son graduadas por rol y escala (la venta organizada de exámenes es un delito grave; la docente individual presionada por el propio sistema no debe ser tratada como traidora a la patria). Lo que disuade es la certeza de detección, no la severidad; el presupuesto del sistema antifraude prioriza detección sobre años de cárcel, y protege y premia al denunciante (whistleblower), que es empíricamente el mejor detector de fraude organizativo que existe.
El cronograma de adopción separa explícitamente la calibración del régimen con consecuencias:
Años 1 y 2 — Medición sin consecuencias. El sistema completo corre en vacío: calibración de instrumentos, equiparación estadística de formas, limpieza del pipeline de datos, logística de jurados, instalación de tarjetas y lectores. Ninguna beca, ninguna intervención formal con consecuencias, ningún dato publicado con stakes. La premisa es directa: un sistema de alto riesgo mal calibrado es peor que ningún sistema, porque produce datos falsos que engañan a quien decide. La plata se conecta al instrumento recién cuando el instrumento ha demostrado que no miente. El costo de la fase piloto para Argentina (incluyendo el capex de tarjetas) se estima en USD 247 millones (0,036 % del PIB), modesto en relación al beneficio informacional.
Año 3 en adelante — Régimen. Primera cohorte con beca en 11.°, gatillos de intervención activos, pilotos aleatorizados en marcha. Solo si la calidad del dato de los años de calibración lo justifica.
Capa cultural opcional: olimpíadas académicas voluntarias y celebratorias, organizadas a nivel nacional o regional, hacen visible y deseable el aprendizaje sin contaminar la medición ni premiar con fondos del sistema. Operan como motor de cultura, no como instrumento de evaluación.
El costo anual del marco para un país adoptante (en USD) responde a la siguiente fórmula paramétrica:
Donde M es la matrícula pública total y M6–11 la matrícula en los grados objetivo; c es el costo por ración alimentaria (entre USD 0,25 para una merienda y USD 3,50 para servicio completo, con USD 1,30 a 1,60 como referencia regional para almuerzo); d es la cantidad de días lectivos (~180); b es el bono mensual de referencia y f la fracción focalizada (40 % para focalización por estrato bajo); E es el número anual de egresados, p la proporción de becados y B la beca total promedio con vesting; S es el número de escuelas públicas y k = USD 6.500 promedia el costo de intervención por escuela en el sistema; F = USD 45 millones representa el costo institucional fijo de la AM y r = USD 11 el costo variable por alumno objetivo; t = USD 2,5 por alumno es el opex tecnológico anual. El capex único de la infraestructura tecnológica responde a S·2.500 + 2·M.
El supuesto del modelo sobre costo de ración alimentaria está anclado en programas existentes de la región (fuentes públicas 2024–2026):
| Programa | Gasto anual | Beneficiarios | USD/alumno/año | Tipo de servicio |
|---|---|---|---|---|
| Brasil PNAE (federal) | USD 976 M | 40 M (100 % básica) | ~24 | Merienda |
| Colombia PAE | ~USD 1.250 M | 5,6 M (80 % cobertura) | ~225 | Complemento / almuerzo |
| Propuesta (modelo) | — | — | 270 | Almuerzo universal |
| Chile JUNAEB PAE | USD 1.332 M | ~2 M | ~666 | Desayuno + almuerzo |
El supuesto del modelo (USD 270 por alumno/año, equivalente a USD 1,50 por almuerzo durante 180 días) cae entre la cobertura colombiana y el estándar chileno: es un precio de mercado regional verificable, no una estimación optimista.
El producto bruto interno 2025 de Argentina fue de USD 680.700 millones; la matrícula del sistema público asciende a 8,12 millones de estudiantes (72 % del total). El gasto educativo consolidado ronda el 3–4 % del PIB; la meta legal vigente (Ley 26.075, suspendida en su aplicación) es del 6 %. La AUH paga aproximadamente USD 100 mensuales por menor a unos 4,3 millones de niños, ya condicionada a escolaridad —representa cerca del 0,77 % del PIB—.
| Componente | USD / año |
|---|---|
| Medición completa (Autoridad de Medición + censo 6.°–10.° + examen de 11.° con 50.000 jurados) | 99 M (0,014 % del PIB) |
| Comedor universal (8,12 M alumnos × USD 1,50 × 180 días) | 2.190 M |
| Bono de asistencia — integrado a la AUH (programa preexistente; el marco aporta verificación diaria automática) | ~0 |
| Becas de 11.° (40 % de egresados × USD 2.000 promedio, con vesting) | 307 M |
| Intervención (escalonamiento + bono de permanencia docente + fondo de infraestructura) | ~580 M |
| Tecnología (opex anual) | 20 M |
| TOTAL — Escenario recomendado | ~2.900 M (0,43 % del PIB) |
El escenario recomendado cuesta menos que la AUH vigente, equivale al 13,5 % del gasto educativo consolidado actual y cabe en aproximadamente un quinto de la brecha hacia la meta del 6 % del PIB que la propia ley argentina ordena. No requiere nuevos tributos: requiere recorrer parte del camino legal ya trazado.
Para un país que ya cuenta con transferencia condicionada a escolaridad y programa alimentario escolar (situación de la mayoría de la región: Argentina, Brasil, Chile, Colombia, México), adoptar el marco completo cuesta entre 0,2 % y 0,3 % del PIB. Para un país que adoptara el marco partiendo de cero en estos dos componentes, el rango es 0,7 %–0,8 % del PIB. El sistema puro de medición, intervención y becas —la «inteligencia» del modelo, sin la comida ni la transferencia— cuesta 0,10 %–0,15 % del PIB en cualquier país. Lo costoso del marco es alimentar a los chicos y compensar a las familias contra el trabajo infantil: dos políticas que la región ya está pagando en buena medida.
Honestidad de alcance: el marco propuesto es la capa de información, bienestar e intervención del sistema educativo. No es una reforma pedagógica. El currículum, la formación docente inicial, los salarios docentes, la primera infancia y el tamaño de las aulas —el motor educativo en sentido estricto— quedan deliberadamente fuera del alcance y requieren sus propias políticas, con su propia justificación y su propio costeo. Medir mejor no enseña mejor por sí mismo. Este marco existe para que las políticas pedagógicas, cuando aparezcan, puedan ser probadas con evidencia y escaladas si funcionan, en lugar de adoptarse por convicción y descartarse sin medirse.
La presente versión es un documento de arquitectura. Quedan abiertos, deliberadamente, los siguientes pendientes de diseño fino:
Este marco se construyó iterativamente entre los meses previos a la fecha de publicación, mediante un proceso de crítica adversarial sistemática: cada componente fue propuesto, atacado en busca de su falla estructural, demolido cuando esa falla aparecía y reemplazado por el diseño que sobrevivía a la crítica. Las versiones tempranas contenían torneos de incentivos, financiamiento por desempeño escolar, premios individuales por puntaje, contratos inteligentes sobre blockchain y otros mecanismos que la literatura comparada ha mostrado problemáticos. Cada uno fue conservado en la bitácora con su razón de descarte, hasta llegar al diseño actual.
Las ideas que sobrevivieron a la crítica iterada componen este documento: la separación termómetro/premio, la custodia ciudadana del examen de alto riesgo, el muestreo estratificado con propiedad autocorrectiva, la transferencia condicionada como instrumento contra el trabajo infantil, los pilotos aleatorizados a nivel escuela y el principio operativo de que el dinero solo toca insumos verificables. La bitácora completa de iteraciones se conserva como documento de trabajo separado y está disponible a solicitud.
El autor invita explícitamente la crítica técnica de este documento por parte de especialistas en política educativa, economía de la educación, psicometría, política social y administración pública latinoamericana. El correo de contacto y las versiones actualizadas están disponibles en migueleonardortiz.com.ar.
Los datos cuantitativos utilizados en este documento provienen de las siguientes fuentes públicas, consultadas en junio de 2026: