¡Ganó un boleto!

¿Cuál escuela quiere apoyar?

Lección 9.3

Pruebas:
medidas estandarizadas de aprendizaje de los estudiantes

¿Cómo puede esta prueba ser tan fácil y tan difícil al mismo tiempo?

hero image

Las pruebas estandarizadas se han vuelto impopulares. En 2020, cuando la pandemia de COVID-19 provocó la cancelación de muchas pruebas, muchos suspiraron aliviados. ¿Qué bien, no?

Bueno… tal vez. Esta lección se enfoca en las pruebas — especialmente las pruebas estandarizadas. Explora cómo se diseñan, cómo se utilizan y por qué han tenido tanto éxito. Resume las pruebas más importantes del sistema educativo de California y presenta puntos de vista conflictivos sobre cómo cambiarlas.

Las pruebas impulsan el éxito económico

Las pruebas miden rápidamente el conocimiento y las habilidades de una persona de manera que permiten comparaciones. Históricamente, las pruebas se utilizaron como una forma de filtrar a las personas para algo. Debido a que las pruebas son una manera eficiente de seleccionar candidatos, su historia se remonta a faraones, emperadores, generales y capitanes de la industria.

Como se discutió en la Lección 1.3 de Ed100, un sistema educativo que funciona bien impulsa el éxito económico, no solo para el individuo, sino para toda la economía. Es una razón bastante poderosa para que un sistema educativo use pruebas.

Los individuos tienen una razón relacionada, pero más específica, para preocuparse por las pruebas. Los estudiantes y los padres se obsesionan con los resultados de las pruebas (especialmente el SAT/ACT, en el caso de los mejores estudiantes) porque están fuertemente vinculados al acceso a la universidad y a las opciones de carrera.

En el blog de Ed100
Inflación de calificaciones

En las últimas décadas, el propósito de las pruebas se ha ampliado más allá del propósito sumativo de otorgar calificaciones o encontrar a los mejores y peores candidatos. Entre otras cosas, las pruebas sirven como herramientas de diagnóstico para que los líderes escolares y los maestros elijan cómo invertir su tiempo. Como se explica en la Lección 6.5 de Ed100, las pruebas pueden usarse con fines formativos, para identificar dónde los estudiantes se están quedando atrás. Las pruebas son invaluables como herramienta para superar el pensamiento ilusorio, un paso necesario hacia la acción. Las pruebas estandarizadas también son un control esencial para combatir la inflación de calificaciones, un problema sistémico que debilita la capacidad del sistema para dejar claras las expectativas y distinguir a los mejores estudiantes.

El sistema de pruebas de California cambió con los estándares

El conjunto de pruebas estandarizadas de California ha cambiado con el tiempo. Desde aproximadamente 2002 hasta 2013, la base del sistema de pruebas del estado fueron las pruebas STAR, también conocidas como las Pruebas de Estándares de California o CSTs. Estas eran pruebas clásicas de llenar burbujas, de talla única, basadas en los estándares estatales de California.

En 2008, Estados Unidos cayó en una recesión, lo que debilitó la financiación estatal y local para los sistemas educativos. El gobierno federal proporcionó una financiación significativa para llenar el vacío, especialmente para los sistemas de educación pública. También proporcionó algunos incentivos de financiamiento: específicamente, a través del programa de subvenciones competitivas Race to the Top, los estados fueron incentivados a revisar, armonizar y mejorar sus estándares educativos por nivel de grado. En 2014, muchos estados, incluido California, hicieron la transición a un conjunto de estándares llamado Common Core.

Los nuevos estándares requerían nuevas pruebas. Dado que diseñar buenas pruebas es difícil y costoso, los estados se unieron. California y muchos estados del oeste se unieron al Consorcio de Evaluación Smarter Balanced (SBAC, pronunciado ESS-back); el otro gran consorcio se conoce como PARCC. No todos los estados están oficialmente en un consorcio. En 2018, la Fundación Hewlett encargó un informe, ¿Qué pasó con todas esas nuevas y mejores pruebas estatales?, para evaluar cómo se había asentado el polvo. La revisión concluyó que las pruebas PARCC son menos mecánicas que las SBAC, pero ambas son sustancialmente mejores que las pruebas utilizadas en estados no miembros de un consorcio.

Fuentes: Ilustración de Education First, Proyecto de Evaluación de Alta Calidad; la investigación citada en el gráfico incluye dos estudios de la Corporación RAND sobre la calidad de las pruebas estatales, AP y otras evaluaciones sumativas comunes (2011 y 2012), así como investigaciones del Instituto Fordham (2016) y HumRRO (2016). Haz clic en la imagen para más información.

Las pruebas de California, conocidas colectivamente como el Sistema de Evaluación del Progreso y Desempeño Estudiantil de California (CAASPP), son en general similares a las utilizadas en otros estados miembros del SBAC. Administradas en computadoras, se adaptan a las habilidades de cada estudiante para determinar un puntaje rápidamente.

El sistema de pruebas CAASPP incluye evaluaciones en inglés y matemáticas, así como la Prueba de Ciencias de California (CAST), que debutó en 2017.

¿Qué prueba
puede evaluar
mejor el éxito?

Los críticos de las pruebas estandarizadas argumentan, en parte, que son un uso ineficiente del tiempo. Algunos estudiantes encuentran las pruebas aburridas, aunque las pruebas adaptativas en computadora son más cortas y menos propensas a este problema. Algunos argumentan que las pruebas estandarizadas son una intrusión degradante que extrae el alma del aprendizaje y la enseñanza.

¿Qué es una prueba de "alto riesgo"?

Las pruebas estandarizadas estatales a veces se describen como pruebas de alto riesgo, implicando que los estudiantes enfrentan algún tipo de penalización si les va mal. Esto es engañoso. En realidad, los estudiantes no tienen grandes razones para hacer trampa. Al contrario: puede ser difícil convencer a los estudiantes de que tomen las pruebas estatales en serio.

A veces, los maestros y administradores presionan a los estudiantes porque sienten que su reputación está en juego. La inseguridad de los maestros respecto a los resultados de las pruebas incluso ha llevado a algunos a hacer trampa. Si los educadores o los líderes escolares no creen que las pruebas sean una medida válida del aprendizaje, los incentivos basados en los resultados pueden crear tentaciones.

¿Qué son las pruebas CAASPP?

Las pruebas Smarter Balanced de California, las CAASPP, se administran al final del año escolar en los grados 3-8 y 11

Las pruebas estatales de California se administran hacia el final del año escolar en inglés y matemáticas para los grados 3 a 8 y para el grado 11. (¿Tienes curiosidad por saber cómo son las pruebas? ¡Pruébalo!)

A principios del verano, los estudiantes y sus padres reciben informes que muestran sus puntajes. Los informes indican visualmente si el puntaje del estudiante está cerca de las expectativas del nivel de grado, por encima o por debajo de ellas, y en qué medida. Aquí tienes parte de un informe de ejemplo de 2023-2024 para Artes del Lenguaje de un estudiante ficticio de quinto grado:

El informe incluye los puntajes del año anterior, lo que puede ayudar a los padres a entender si el estudiante está generalmente manteniéndose al nivel de las expectativas de grado en Artes del Lenguaje Inglés/Literatura (ELA), quedándose atrás o avanzando. El informe también proporciona promedios escolares y estatales para que los padres puedan comparar a sus estudiantes con sus compañeros.

Encuentra mucha más información sobre las pruebas CAASPP aquí: startingsmarter.org. Estas pruebas son parte del Panel de Control Escolar de California, que presentamos en Ed100 Lección 9.7.

Las pruebas adaptativas se ajustan al estudiante

Las pruebas CAASPP son 'adaptativas'. Administradas en línea, presentan a cada estudiante preguntas de diferente dificultad para evaluar su nivel con la menor cantidad de preguntas posible.

En el pasado, a todos los estudiantes se les daba la misma prueba, en papel. Inevitablemente, las preguntas aburrían a algunos estudiantes mientras que frustraban a otros.

Administrar las pruebas en computadoras fue un gran cambio. Esto permitió al consorcio diseñar pruebas que se adaptan a las habilidades del estudiante. Una prueba adaptativa como CAASPP presenta a cada estudiante una versión diferente de la prueba, seleccionando preguntas que varían en dificultad (y valor de puntaje). Idealmente, cada estudiante toma una versión de la prueba "a la medida". Ni demasiado difícil, ni demasiado fácil: justo adecuada. Esto permite que la prueba evalúe con mayor éxito el "nivel" de cada estudiante con menos preguntas y con mayor certeza que las antiguas pruebas en papel.

¿Qué son las evaluaciones alternativas?

Para satisfacer las necesidades de los estudiantes con discapacidades, California también ofrece "evaluaciones alternativas" basadas en computadora (CAA) alineadas con los Estándares Estatales Comunes (Common Core). El objetivo: garantizar que los estudiantes con discapacidades cognitivas significativas logren resultados académicos cada vez más altos y terminen la escuela secundaria preparados para opciones posteriores. (Estas evaluaciones reemplazaron a las pruebas CAPA). Mira el video para más información. (Versión en español aquí).

Pruebas para estudiantes de inglés

Los estudiantes cuyo idioma materno no es el inglés toman una prueba diferente conocida como ELPAC. Una prueba inicial sirve para identificar a los estudiantes que podrían necesitar apoyo adicional en el idioma. La prueba completa de ELPAC mide el progreso hacia la competencia en inglés. Existen versiones alternativas para acomodar a los estudiantes con discapacidades cognitivas.

A pesar de las críticas, las pruebas llegaron para quedarse

Críticos como la comentarista educativa Diane Ravitch argumentan que las pruebas estandarizadas consumen demasiado tiempo y llevan a las escuelas a enfocarse demasiado en las áreas temáticas evaluadas. (En la jerga educativa, esto se conoce como “estrechamiento del currículo”). El tiempo de clase para arte (ver Lección 6.8 Las artes), música e incluso ciencias se ha reducido porque los maestros y líderes escolares sienten presión para asegurarse de que los estudiantes obtengan buenos resultados en las pruebas de matemáticas e inglés.

Las pruebas anuales para todos los estudiantes son una prioridad clave para muchas organizaciones de derechos civiles. Al requerir la participación universal, estas pruebas refuerzan la idea de que la educación debe funcionar para todos los estudiantes. La participación universal también reduce la tentación de las escuelas de omitir los puntajes de los estudiantes menos preparados.

Es legal que los padres "opten por no participar" en las pruebas administradas por el estado de California. Afortunadamente, muy pocos lo hacen. El acceso a algunos fondos federales depende de la participación de al menos el 95% de los estudiantes. La lógica detrás de exigir esta alta tasa de participación es evitar la tentación de que las escuelas o distritos “oculten” a los estudiantes que podrían no obtener buenos resultados.

El apoyo público a las pruebas anuales es fuerte y amplio, incluso entre los maestros. En respuesta a la crítica de que las pruebas se han centrado únicamente en matemáticas e inglés, California agregó evaluaciones en ciencias y emprendió nuevos cambios en los estándares para las artes visuales, escénicas y mediáticas.

California abandonó su Examen de Egreso de Secundaria (CAHSEE)

Durante muchos años, California requería que los estudiantes de secundaria aprobaran el Examen de Egreso de Secundaria de California (CAHSEE) para obtener un diploma. Una prueba de burbujas de talla única, el CAHSEE era muy fácil para la mayoría de los estudiantes. Aun así, para algunos era lo único que les impedía graduarse. En 2015, el examen fue suspendido, y en 2017 fue abandonado definitivamente.

Los efectos de los exámenes de egreso han sido ampliamente investigados. Para algunos estudiantes, hay evidencia de que el CAHSEE cumplió su función prevista como un estímulo. Pero este efecto fue superado por su resultado no intencionado: motivó a otros estudiantes con dificultades a abandonar la secundaria por completo.

¿Por qué importa el CAASPP?

Cuando los estudiantes de secundaria toman la prueba CAASPP, tienen una razón personal para preocuparse por su puntaje. A través del Programa de Evaluación Temprana (EAP), los puntajes en el CAASPP brindan a las universidades evidencia de que los estudiantes están preparados para el trabajo a nivel universitario sin necesidad de tomar cursos remediales. (Para más información, ver Lección 9.4.)

La desaparición repentina de las pruebas de alto riesgo: SAT y ACT

Durante décadas, los estudiantes que querían asistir a la universidad tomaban de forma rutinaria el examen SAT o ACT como parte del proceso de admisión. En algunos estados, esto sigue siendo común, pero en California la mayoría de los estudiantes que planean ir a la universidad ya no toman los exámenes a menos que piensen que pueden destacarse al hacerlo. Algunas universidades selectivas aceptan los puntajes, y otras no.

Los promedios de calificaciones en la secundaria predicen el éxito universitario...

La desaparición de los exámenes universitarios en California fue un cambio enorme y repentino que ocurrió durante la pandemia de COVID-19. Justo antes de la pandemia, algunas organizaciones de derechos civiles cuestionaron si los exámenes eran justos. Como exploró Paul Tough en su libro de 2020 The Years That Matter Most, los estudiantes de familias privilegiadas podían ofrecer consistentemente ventajas a sus hijos que las familias con menos recursos no podían. En 2020, un tribunal prohibió a la Universidad de California usar los exámenes en las decisiones de admisión.

Desde ese punto de inflexión, el final llegó rápidamente. Las universidades selectivas son muy sensibles a su reputación. Sin un verdadero incentivo para defender el uso de los exámenes, los departamentos de admisión de las universidades rápidamente los abandonaron o los hicieron opcionales. Después de todo, la investigación realizada por College Board (el creador del SAT) había demostrado que el mejor predictor único del éxito de un estudiante en la universidad es su promedio de calificaciones en la secundaria. Los creadores del examen ACT están de acuerdo, al igual que investigaciones independientes.

Entonces, ¿cuál es el problema, verdad? ¿Por qué no eliminar los exámenes y confiar únicamente en las calificaciones? Porque la combinación funciona aún mejor. Antes de que el uso de los puntajes SAT/ACT se convirtiera en un riesgo para la reputación, las universidades les daban un peso significativo porque ayudaban a predecir el éxito estudiantil en la universidad. Los puntajes ayudaban a las oficinas de admisiones a identificar buenos candidatos en escuelas con alta pobreza. Sin los exámenes, las oficinas de admisiones tienen más dificultades para tomar riesgos con candidatos menos obvios.

Los promedios de calificaciones y los puntajes del SAT/ACT no miden lo mismo. Algunos estudiantes maravillosos son pésimos en los exámenes. Algunos excelentes en los exámenes son pésimos estudiantes. Tener éxito en un examen requiere superar la ansiedad y la distracción, y ser capaz de cambiar rápidamente de una pregunta a otra. Tener éxito en clase requiere la capacidad de aplicar esfuerzo para entregar trabajo académico.

...pero la predicción es aún mejor cuando se combina con los puntajes del ACT/SAT.

Es importante reconocer que eliminar el uso del ACT/SAT probablemente ha sido perjudicial desde una perspectiva de equidad. El senado académico de la Universidad de California convocó a un grupo de trabajo para estudiar el tema. Para sorpresa de muchos, el grupo de trabajo recomendó mantener los exámenes, en parte como una forma de superar la inflación generalizada de calificaciones en las secundarias.

"De hecho, los puntajes de las pruebas son mejores predictores de éxito para estudiantes que son minorías subrepresentadas (URMs), que son de primera generación o cuyas familias tienen bajos ingresos… Una consecuencia de eliminar los puntajes de las pruebas sería una mayor dependencia del [Promedio de Calificaciones de la Secundaria (HSGPA)] en las admisiones. El grupo de trabajo encontró que las secundarias de California varían mucho en los estándares de calificación, y que la inflación de calificaciones es parte de la razón por la que el poder predictivo del HSGPA ha disminuido desde el último estudio de la UC."

Según esta lógica, la pérdida del ACT/SAT probablemente ha hecho que las decisiones de admisión en universidades selectivas sean menos inclusivas, no más.

Otras formas de medir el desempeño estudiantil

Como una alternativa más amplia y atractiva a las pruebas estandarizadas, algunos han propuesto que los estudiantes demuestren su competencia produciendo un “portafolio” — el equivalente en secundaria a un proyecto de tesis de pregrado. Los estudiantes negocian un tema de investigación con asesores y producen un trabajo multidisciplinario que demuestra su conocimiento y habilidades en varias áreas temáticas. Sus portafolios son calificados contra un conjunto de "rúbricas" que incorporan estándares estatales. El estado de Vermont fue el que más lejos llegó al adoptar formalmente esta estrategia, y en el proceso demostró muchos de sus desafíos. La evaluación basada en portafolios sigue siendo poco común, y el término ha caído algo en desuso. Si tu hijo está trabajando en un "proyecto final" o una "tesis final" esto puede ser un eco de la idea del portafolio.

Calificaciones en clase: ¿Qué es una rúbrica?

La mayor parte del trabajo que los estudiantes hacen en clase o como tarea es asignado y calificado por un maestro. ¿Cómo expresan los maestros lo que cuenta y cómo deciden las calificaciones?

Una rúbrica no es un cubo de rompecabezas. Es una herramienta que los maestros utilizan para explicar lo que esperan de los estudiantes cuando asignan trabajo y para calificar la calidad del trabajo completado. Las rúbricas suelen estar organizadas en columnas que describen qué cuenta. Por ejemplo, un informe podría valer un total de 100 puntos: hasta 50 puntos por la calidad de la investigación, 30 por la calidad de la escritura y 20 por la calidad de la presentación. Las filas de la rúbrica describen las expectativas para diferentes niveles de calidad — por ejemplo, ¿qué tipo de investigación es más importante y cuál debería ser la extensión del trabajo?

Crear una buena rúbrica es difícil y consume tiempo. En 2025, las herramientas de inteligencia artificial para ayudar a los maestros a construir rúbricas eran un tema común en conferencias y blogs relacionados con la educación. (Ejemplos incluyen MagicSchool, AI Grading Assistant y otros. Maestros: si tienen una herramienta favorita, ¡por favor dejen un comentario!)

Por supuesto, los resultados que realmente importan son a largo plazo. Los puntajes importan si abren puertas. El verdadero éxito en la educación K-12 abre opciones. Esas opciones son el tema de la próxima lección.

Actualizado en enero de 2025

Prueba

¿En qué prueba estandarizada confía más California para evaluar el aprendizaje de los alumnos?

Responda correctamente la pregunta y ganará un boleto.
Conocer más

Preguntas y comentarios

Para comentar o responder, por favor inicie sesión .

©2003-2025 Jeff Camp
Diseño por SimpleSend

¡Compartir es vivir!

Restablecer contraseña

¿Cambió de idea? Iniciar sesión.

Buscar aquí en el contenido del blog y todas las lecciones.

¡Bienvenido de nuevo!

Iniciar sesión con correo electrónico

We will send your Login Link to your email
address. Click on the link and you will be
logged into Ed100. No more passwords to
remember!

Compartir por correo electrónico

Get on Board!
Learn how California's School System works so you can make a difference.
Our free lessons are short, easy to read, and up to date. Each lesson you complete earns a ticket for your school. You could win $1,000 for your PTA.

Unirse a Ed100

Already a member? Login

O crear una cuenta