quinta-feira, 28 de maio de 2026

ENSAIO: Inteligência Artificial e Práticas de Avaliação no Ensino Superior: da Crise à Reinvenção

 

Nota: Capa gerada por IA/ Ensaio em Co-Autoria Humano-IA

Inteligência Artificial e Práticas de Avaliação no Ensino Superior:

Da Crise à Reinvenção

 Introdução

Quando a inteligência artificial generativa começou a redigir ensaios académicos com a fluência de um estudante universitário, não destruiu a avaliação no ensino superior — revelou o que ela já era: frágil, previsível e demasiado fácil de contornar. A inteligência artificial generativa não criou o problema; expô-lo, com uma clareza que já não admite adiamento.

Felix e Webb (2024) mapeiam as duas faces desta transformação: por um lado, as possibilidades reais de personalização, de feedback adaptativo e de apoio à docência; por outro, as preocupações legítimas quanto à integridade académica e ao enfraquecimento das competências dos estudantes. O dilema não é tecnológico — é pedagógico.

Este ensaio percorre três perspetivas complementares para o enfrentar: o diagnóstico da literatura especializada sobre IA e avaliação (Felix & Webb, 2024; O'Dea & O'Dea, 2023; Swiecki et al., 2022); o quadro conceptual da avaliação digital autêntica (Oliveira & Pereira, 2021) como resposta orientadora; e as propostas de redesenho de Kickbusch et al. (2025), que formulam a inflexão essencial — em vez de policiamento, design. O argumento central é simples: a resposta à IA não é a proibição nem a vigilância, mas a construção de uma avaliação que sempre deveria ter existido.

  I.             A IA no ensino superior: oportunidades, limites e desafios para a avaliação

Felix e Webb (2024) oferecem um mapa abrangente das utilizações atuais e potenciais da IA no ensino superior, estruturado em torno de três eixos: a entrega de conteúdos educativos, o apoio a docentes e a avaliação da aprendizagem. No domínio da avaliação, as ferramentas de IA permitem já hoje a geração automática de questões, a classificação automatizada de produções escritas e o fornecimento de feedback personalizado em tempo real — possibilidades que, em contextos de massificação do ensino superior, têm uma relevância prática inegável. No entanto, os autores identificam riscos que exigem atenção: a dificuldade crescente de detetar produções geradas por IA, a possibilidade de os estudantes delegarem nelas a realização de tarefas avaliativas, e o risco de que docentes excessivamente dependentes da classificação automática percam a profundidade de julgamento que o contacto direto com o trabalho dos estudantes proporciona. A linha entre assistência legítima e substituição do esforço intelectual torna-se progressivamente mais ténue — e as ferramentas de deteção, como os autores sublinham, estão longe de oferecer uma solução fiável.

Esta tensão é aprofundada por O'Dea e O'Dea (2023), que adotam uma postura deliberadamente cautelosa perante os discursos entusiastas sobre a IA. Apoiando-se num modelo que articula conhecimento tecnológico, pedagógico e de conteúdo (TPACK), e numa teoria que analisa os fatores que determinam a adoção de tecnologia em contexto organizacional (UTAUT), os autores argumentam que a IA, no seu estado atual, não introduz avanços pedagógicos verdadeiramente novos. Não existem evidências robustas de que as ferramentas disponíveis melhorem efetivamente as aprendizagens ou transformem de forma sustentada as práticas dos docentes. Os recursos pedagógicos da IA permanecem insuficientemente definidos, e os desafios da sua adoção operam em três níveis: nacional (ausência de políticas claras), institucional (infraestruturas inadequadas) e pessoal (formação docente insuficiente). A tecnologia, por si só, não muda as práticas pedagógicas — muda-as a formação, a reflexão crítica e a cultura institucional.

Swiecki et al. (2022) oferecem o diagnóstico mais sistematizado das limitações da avaliação tradicional: ela oferece apenas fotografias instantâneas do desempenho em momentos discretos, é raramente adaptada aos perfis individuais dos estudantes, e avalia competências que os próprios humanos já delegam em ferramentas computacionais — o que questiona radicalmente a sua pertinência na era da IA. Os autores revisitam abordagens baseadas em IA que endereçam parcialmente estas limitações, mas advertem: cada uma introduz novos problemas de explicabilidade algorítmica, de equidade e de esvaziamento do papel do docente. A delegação de decisões avaliativas em sistemas de IA corre o risco de transformar o professor em supervisor de algoritmos em vez de promotor ativo de aprendizagem.

O que emerge da leitura conjunta destes três textos é claro: a IA não criou a crise da avaliação no ensino superior — expô-la e amplificou-a. A pergunta que se impõe é a mesma que deveria ter sido formulada há décadas: que práticas avaliativas são genuinamente formativas e adequadas ao tipo de cidadãos que o ensino superior pretende formar?

II.            Avaliação digital autêntica: o quadro conceptual de resposta

Oliveira e Pereira (2021) sistematizam o conceito de avaliação digital autêntica e os desafios da sua implementação em contextos de eLearning. A distinção central é clara: enquanto a avaliação tradicional mede conhecimentos estáticos em momentos discretos, a avaliação autêntica orienta-se para evidências de competência em contextos de aplicação significativa. A dimensão "digital" não é meramente instrumental — implica repensar as modalidades de evidência, de feedback e de participação dos estudantes no processo avaliativo.

A relevância para o debate sobre IA é direta. Se a avaliação autêntica exige análise crítica, resolução de problemas em contexto e reflexão sobre o próprio percurso, ela é, por definição, menos suscetível de ser transferida para ferramentas de IA. Uma defesa oral, um portfólio reflexivo ou a análise de um caso real implicam a presença e o julgamento do próprio estudante — algo que nenhum modelo de linguagem pode substituir.

As autoras identificam, porém, desafios reais: garantir a autoria em ambientes online, formar docentes para o design de tarefas autênticas e superar a resistência cultural a sistemas avaliativos estandardizados. Estes desafios, anteriores à IA generativa, foram por ela agravados — e é precisamente aí que Kickbusch et al. (2025) intervêm.

III.          Para além da deteção: redesenhar a avaliação num mundo mediado por IA

Kickbusch et al. (2025) propõem uma reorientação conceptual fundamental: em vez de tentar policiá-la, a autenticidade avaliativa deve ser redesenhada para um mundo em que a IA é uma presença esperada, declarada e criticamente examinada. A inflexão é decisiva — o foco desloca-se do resultado final para o processo: como os estudantes aplicam conhecimento, exercem julgamento e justificam escolhas quando a IA está no ciclo.

Os autores propõem padrões de conceção pedagógica adaptáveis a qualquer disciplina que invertem a lógica dominante: em vez de ameaça, a IA é posicionada como ferramenta de aprendizagem a integrar criticamente. Isso implica tarefas que exigem criticar, adaptar e verificar outputs de IA; transparência explícita sobre o processo (prompts, iterações, justificações); e artefactos reflexivos — diários de processo, defesas orais, comentários metacognitivos — que tornam o pensamento dos estudantes visível. A convergência com Oliveira e Pereira (2021) é direta: tarefas contextualizadas, evidências de processo, participação ativa na co-construção dos critérios.

Quando se pede a um estudante que avalie um plano de aula gerado por IA à luz de critérios de inclusão pedagógica, a IA não pode realizar essa tarefa em seu lugar — porque a tarefa consiste precisamente em exercitar o julgamento profissional que ela não possui. É esse julgamento progressivo que Boud e Soler (2015) designam por evaluative judgement: a capacidade de apreciar e regular a qualidade do próprio trabalho de forma autónoma, para além de qualquer unidade curricular.

Panadero et al. (2016) completam o quadro: os instrumentos de auto e heteroavaliação — rubricas, guiões, prompts reflexivos — são simultaneamente mais resistentes à delegação em IA e mais formativos. Rodríguez-Gómez e Ibarra-Sáiz (2015) reforçam o argumento central: avaliar é, antes de tudo, capacitar os estudantes para aprenderem de forma autónoma e sustentada.

Conclusão

A inteligência artificial não criou a crise da avaliação no ensino superior — apenas lhe retirou o véu. As fragilidades que Swiecki et al. (2022) identificam nas práticas avaliativas tradicionais já lá estavam: a superficialidade, a desadequação ao mundo real, a incapacidade de acompanhar a aprendizagem como processo vivo. A IA tornou-as simplesmente impossíveis de ignorar.

E talvez seja esse o seu maior contributo involuntário para a pedagogia. Não como ameaça, mas como espelho. Um espelho que nos devolve a pergunta que sempre deveria ter sido feita: para que serve, afinal, avaliar?

As respostas que a literatura aponta — autenticidade digital (Oliveira & Pereira, 2021), design em vez de vigilância (Kickbusch et al., 2025), julgamento avaliativo (Boud & Soler, 2015), autonomia progressiva (Panadero et al., 2016) — convergem num mesmo horizonte: uma avaliação que não meça o que os estudantes sabem num momento discreto, mas que os forme para continuar a aprender quando ninguém os estiver a avaliar.

Esse é o verdadeiro desafio. E também, finalmente, a oportunidade.

Referências

Boud, D., & Soler, R. (2015). Sustainable assessment revisited. Assessment & Evaluation in Higher Education, 41(3), 400–413. https://doi.org/10.1080/02602938.2015.1018133

Felix, J., & Webb, L. (2024). Use of artificial intelligence in education delivery and assessment (POST Note 712). UK Parliament, Parliamentary Office of Science and Technology. https://doi.org/10.58248/PN712

Kickbusch, S., Ashford-Rowe, K., Kemp, A., Boreland, J., & Huijser, H. (2025). Beyond detection: Redesigning authentic assessment in an AI-mediated world. Education Sciences, 15(11), 1537. https://doi.org/10.3390/educsci15111537

O'Dea, X., & O'Dea, M. (2023). Is artificial intelligence really the next big thing in learning and teaching in higher education? A conceptual paper. Journal of University Teaching & Learning Practice, 20(5). https://doi.org/10.53761/1.20.5.06

Oliveira, I., & Pereira, A. (2021). Avaliação digital autêntica: questões e desafios. RE@D — Revista de Educação a Distância e eLearning, 4(2), 22–40. https://doi.org/10.34627/vol4iss2pp22-40

Panadero, E., Jonsson, A., & Strijbos, J. W. (2016). Scaffolding self-regulated learning through self-assessment and peer assessment: Guidelines for classroom implementation. In D. Laveault & L. Allal (Eds.), Assessment for learning: Meeting the challenge of implementation (pp. 311–326). Springer. https://doi.org/10.1007/978-3-319-39211-0_18

Rodríguez-Gómez, G., & Ibarra-Sáiz, M. S. (2015). Assessment as learning and empowerment: Towards sustainable learning in higher education. In M. Peris-Ortiz & J. M. Merigó Lindahl (Eds.), Sustainable learning in higher education: Developing competencies for the global marketplace (pp. 1–20). Springer. https://doi.org/10.1007/978-3-319-10804-9_1

Swiecki, Z., Khosravi, H., Chen, G., Martinez-Maldonado, R., Lodge, J. M., Milligan, S., Selwyn, N., & Gašević, D. (2022). Assessment in the age of artificial intelligence. Computers and Education: Artificial Intelligence, 3, 100075. https://doi.org/10.1016/j.caeai.2022.100075

 



Sem comentários:

Enviar um comentário