Nota: Capa gerada por IA/ Ensaio em Co-Autoria Humano-IA
Inteligência
Artificial e Práticas de Avaliação no Ensino Superior:
Da Crise à
Reinvenção
Quando a inteligência artificial generativa começou a
redigir ensaios académicos com a fluência de um estudante universitário, não
destruiu a avaliação no ensino superior — revelou o que ela já era: frágil,
previsível e demasiado fácil de contornar. A inteligência artificial generativa
não criou o problema; expô-lo, com uma clareza que já não admite adiamento.
Felix e Webb (2024) mapeiam as duas faces desta
transformação: por um lado, as possibilidades reais de personalização, de
feedback adaptativo e de apoio à docência; por outro, as preocupações legítimas
quanto à integridade académica e ao enfraquecimento das competências dos
estudantes. O dilema não é tecnológico — é pedagógico.
Este ensaio percorre três perspetivas complementares
para o enfrentar: o diagnóstico da literatura especializada sobre IA e
avaliação (Felix & Webb, 2024; O'Dea & O'Dea, 2023; Swiecki et al.,
2022); o quadro conceptual da avaliação digital autêntica (Oliveira &
Pereira, 2021) como resposta orientadora; e as propostas de redesenho de
Kickbusch et al. (2025), que formulam a inflexão essencial — em vez de
policiamento, design. O argumento central é simples: a resposta à IA não é a
proibição nem a vigilância, mas a construção de uma avaliação que sempre
deveria ter existido.
Felix e Webb (2024) oferecem um mapa abrangente das
utilizações atuais e potenciais da IA no ensino superior, estruturado em torno
de três eixos: a entrega de conteúdos educativos, o apoio a docentes e a
avaliação da aprendizagem. No domínio da avaliação, as ferramentas de IA
permitem já hoje a geração automática de questões, a classificação automatizada
de produções escritas e o fornecimento de feedback personalizado em tempo real
— possibilidades que, em contextos de massificação do ensino superior, têm uma
relevância prática inegável. No entanto, os autores identificam riscos que
exigem atenção: a dificuldade crescente de detetar produções geradas por IA, a
possibilidade de os estudantes delegarem nelas a realização de tarefas
avaliativas, e o risco de que docentes excessivamente dependentes da
classificação automática percam a profundidade de julgamento que o contacto
direto com o trabalho dos estudantes proporciona. A linha entre assistência
legítima e substituição do esforço intelectual torna-se progressivamente mais
ténue — e as ferramentas de deteção, como os autores sublinham, estão longe de
oferecer uma solução fiável.
Esta tensão é aprofundada por O'Dea e O'Dea (2023),
que adotam uma postura deliberadamente cautelosa perante os discursos
entusiastas sobre a IA. Apoiando-se num modelo que articula conhecimento
tecnológico, pedagógico e de conteúdo (TPACK), e numa teoria que analisa os
fatores que determinam a adoção de tecnologia em contexto organizacional
(UTAUT), os autores argumentam que a IA, no seu estado atual, não introduz
avanços pedagógicos verdadeiramente novos. Não existem evidências robustas de
que as ferramentas disponíveis melhorem efetivamente as aprendizagens ou
transformem de forma sustentada as práticas dos docentes. Os recursos
pedagógicos da IA permanecem insuficientemente definidos, e os desafios da sua
adoção operam em três níveis: nacional (ausência de políticas claras),
institucional (infraestruturas inadequadas) e pessoal (formação docente
insuficiente). A tecnologia, por si só, não muda as práticas pedagógicas —
muda-as a formação, a reflexão crítica e a cultura institucional.
Swiecki et al. (2022) oferecem o diagnóstico mais
sistematizado das limitações da avaliação tradicional: ela oferece apenas
fotografias instantâneas do desempenho em momentos discretos, é raramente
adaptada aos perfis individuais dos estudantes, e avalia competências que os
próprios humanos já delegam em ferramentas computacionais — o que questiona
radicalmente a sua pertinência na era da IA. Os autores revisitam abordagens
baseadas em IA que endereçam parcialmente estas limitações, mas advertem: cada
uma introduz novos problemas de explicabilidade algorítmica, de equidade e de
esvaziamento do papel do docente. A delegação de decisões avaliativas em
sistemas de IA corre o risco de transformar o professor em supervisor de
algoritmos em vez de promotor ativo de aprendizagem.
O que emerge da leitura conjunta destes três textos é
claro: a IA não criou a crise da avaliação no ensino superior — expô-la e
amplificou-a. A pergunta que se impõe é a mesma que deveria ter sido formulada
há décadas: que práticas avaliativas são genuinamente formativas e
adequadas ao tipo de cidadãos que o ensino superior pretende formar?
II.
Avaliação digital autêntica: o quadro conceptual de
resposta
Oliveira e Pereira (2021) sistematizam o conceito de
avaliação digital autêntica e os desafios da sua implementação em contextos de
eLearning. A distinção central é clara: enquanto a avaliação tradicional mede
conhecimentos estáticos em momentos discretos, a avaliação autêntica orienta-se
para evidências de competência em contextos de aplicação significativa. A
dimensão "digital" não é meramente instrumental — implica repensar as
modalidades de evidência, de feedback e de participação dos estudantes no processo
avaliativo.
A relevância para o debate sobre IA é direta. Se a
avaliação autêntica exige análise crítica, resolução de problemas em contexto e
reflexão sobre o próprio percurso, ela é, por definição, menos suscetível de
ser transferida para ferramentas de IA. Uma defesa oral, um portfólio reflexivo
ou a análise de um caso real implicam a presença e o julgamento do próprio
estudante — algo que nenhum modelo de linguagem pode substituir.
As autoras identificam, porém, desafios reais:
garantir a autoria em ambientes online, formar docentes para o design de
tarefas autênticas e superar a resistência cultural a sistemas avaliativos
estandardizados. Estes desafios, anteriores à IA generativa, foram por ela
agravados — e é precisamente aí que Kickbusch et al. (2025) intervêm.
III.
Para além da deteção: redesenhar a avaliação num mundo
mediado por IA
Kickbusch et al. (2025) propõem uma reorientação
conceptual fundamental: em vez de tentar policiá-la, a autenticidade avaliativa
deve ser redesenhada para um mundo em que a IA é uma presença esperada,
declarada e criticamente examinada. A inflexão é decisiva — o foco desloca-se
do resultado final para o processo: como os estudantes aplicam conhecimento,
exercem julgamento e justificam escolhas quando a IA está no ciclo.
Os autores propõem padrões de conceção pedagógica
adaptáveis a qualquer disciplina que invertem a lógica dominante: em vez de
ameaça, a IA é posicionada como ferramenta de aprendizagem a integrar
criticamente. Isso implica tarefas que exigem criticar, adaptar e verificar
outputs de IA; transparência explícita sobre o processo (prompts,
iterações, justificações); e artefactos reflexivos — diários de processo,
defesas orais, comentários metacognitivos — que tornam o pensamento dos
estudantes visível. A convergência com Oliveira e Pereira (2021) é direta:
tarefas contextualizadas, evidências de processo, participação ativa na co-construção
dos critérios.
Quando se pede a um estudante que avalie um plano de
aula gerado por IA à luz de critérios de inclusão pedagógica, a IA não pode
realizar essa tarefa em seu lugar — porque a tarefa consiste precisamente em
exercitar o julgamento profissional que ela não possui. É esse julgamento
progressivo que Boud e Soler (2015) designam por evaluative judgement: a
capacidade de apreciar e regular a qualidade do próprio trabalho de forma
autónoma, para além de qualquer unidade curricular.
Panadero et al. (2016) completam o quadro: os
instrumentos de auto e heteroavaliação — rubricas, guiões, prompts
reflexivos — são simultaneamente mais resistentes à delegação em IA e mais
formativos. Rodríguez-Gómez e Ibarra-Sáiz (2015) reforçam o argumento central:
avaliar é, antes de tudo, capacitar os estudantes para aprenderem de forma
autónoma e sustentada.
Conclusão
A inteligência artificial não criou a crise da
avaliação no ensino superior — apenas lhe retirou o véu. As fragilidades que
Swiecki et al. (2022) identificam nas práticas avaliativas tradicionais já lá
estavam: a superficialidade, a desadequação ao mundo real, a incapacidade de
acompanhar a aprendizagem como processo vivo. A IA tornou-as simplesmente
impossíveis de ignorar.
E talvez seja esse o seu maior contributo involuntário
para a pedagogia. Não como ameaça, mas como espelho. Um espelho que nos devolve
a pergunta que sempre deveria ter sido feita: para que serve, afinal,
avaliar?
As respostas que a literatura aponta — autenticidade digital (Oliveira & Pereira, 2021), design em vez de vigilância (Kickbusch et al., 2025), julgamento avaliativo (Boud & Soler, 2015), autonomia progressiva (Panadero et al., 2016) — convergem num mesmo horizonte: uma avaliação que não meça o que os estudantes sabem num momento discreto, mas que os forme para continuar a aprender quando ninguém os estiver a avaliar.
Esse é o verdadeiro desafio. E também, finalmente, a oportunidade.
Referências
Boud, D., & Soler, R. (2015).
Sustainable assessment revisited. Assessment & Evaluation in Higher
Education, 41(3), 400–413. https://doi.org/10.1080/02602938.2015.1018133
Felix, J., & Webb, L. (2024). Use
of artificial intelligence in education delivery and assessment (POST Note
712). UK Parliament, Parliamentary Office of Science and Technology.
https://doi.org/10.58248/PN712
Kickbusch, S., Ashford-Rowe, K.,
Kemp, A., Boreland, J., & Huijser, H. (2025). Beyond detection: Redesigning
authentic assessment in an AI-mediated world. Education Sciences, 15(11), 1537.
https://doi.org/10.3390/educsci15111537
O'Dea, X., & O'Dea, M. (2023). Is
artificial intelligence really the next big thing in learning and teaching in
higher education? A conceptual paper. Journal of University Teaching &
Learning Practice, 20(5). https://doi.org/10.53761/1.20.5.06
Oliveira, I., & Pereira, A.
(2021). Avaliação digital autêntica: questões e desafios. RE@D — Revista de
Educação a Distância e eLearning, 4(2), 22–40.
https://doi.org/10.34627/vol4iss2pp22-40
Panadero, E., Jonsson, A., &
Strijbos, J. W. (2016). Scaffolding self-regulated learning through
self-assessment and peer assessment: Guidelines for classroom implementation.
In D. Laveault & L. Allal (Eds.), Assessment for learning: Meeting the challenge
of implementation (pp. 311–326). Springer.
https://doi.org/10.1007/978-3-319-39211-0_18
Rodríguez-Gómez, G., &
Ibarra-Sáiz, M. S. (2015). Assessment as learning and empowerment: Towards
sustainable learning in higher education. In M. Peris-Ortiz & J. M. Merigó
Lindahl (Eds.), Sustainable learning in higher education: Developing competencies
for the global marketplace (pp. 1–20). Springer.
https://doi.org/10.1007/978-3-319-10804-9_1
Swiecki, Z., Khosravi, H., Chen, G.,
Martinez-Maldonado, R., Lodge, J. M., Milligan, S., Selwyn, N., & Gašević,
D. (2022). Assessment in the age of artificial intelligence. Computers and
Education: Artificial Intelligence, 3, 100075. https://doi.org/10.1016/j.caeai.2022.100075
