홈으로 이동

AI 시대에 학교 글쓰기 평가가 직면한 문제

기사 분량: 1610자, 5분 소요
최지환IT
교실에서 학생들이 글쓰기 과제를 수행하는 가운데 한 학생이 노트북으로 AI를 사용하는 모습을 그린 AI 일러스트
교실에서 학생들이 글쓰기 과제를 수행하는 가운데 한 학생이 노트북으로 AI를 사용하는 모습을 그린 AI 일러스트

생성형 인공지능 확산으로 과제 대필, 탐지 오류, 평가 방식 재설계 요구 증가

생성형 인공지능 기술 확산이 학교 글쓰기 평가 방식에 큰 논쟁을 불러오고 있다. 글을 빠르게 만들어내는 기술이 교육 환경에 들어오면서 과제 수행 방식, 평가 신뢰성, 교육 목적까지 여러 영역에서 문제가 드러나고 있다. 교육 연구자와 교사 사이에서는 기존 글쓰기 평가가 더 이상 학생의 실제 학습을 정확히 측정하기 어렵다는 지적이 이어진다.

가장 먼저 제기되는 문제는 학생이 인공지능을 이용해 글을 대신 작성할 수 있다는 점이다. 생성형 인공지능은 질문이나 주제만 입력하면 짧은 시간 안에 완성된 에세이와 보고서를 만들어 낸다. 문장 구조와 내용도 사람의 글과 유사하다. 이 때문에 학생이 직접 글을 쓰지 않아도 과제를 제출할 수 있는 환경이 형성됐다. 대학 강의에서는 인공지능을 활용한 새로운 형태의 부정행위 사례가 증가했다는 보고가 이어진다. 일부 교육기관에서는 대량의 과제에서 인공지능 사용 흔적이 발견되며 학내 조사로 이어지기도 했다.

문제는 인공지능이 작성한 글을 정확히 구별하기 어렵다는 점이다. 많은 학교가 인공지능 탐지 프로그램을 도입했다. 이 도구는 문장 구조와 단어 사용 방식 등을 분석해 인공지능 작성 가능성을 판단한다. 그러나 정확도 문제는 여전히 해결되지 않았다. 연구에서는 일부 탐지 시스템의 정확도가 80퍼센트 이하로 나타났다. 학생이 문장을 조금 수정하거나 표현을 바꾸면 탐지를 피할 수 있는 사례도 보고됐다. 탐지 기술이 완전하지 않다는 사실은 평가 과정의 신뢰성 문제로 이어진다.

전통적인 글쓰기 과제 방식 자체가 인공지능에 쉽게 대응된다는 점도 구조적 문제로 지적된다. 많은 학교에서 사용하는 짧은 에세이 형태 과제는 일정한 형식을 갖춘 설명 글이다. 생성형 인공지능은 이런 유형의 글을 비교적 쉽게 작성할 수 있다. 연구에서는 인공지능이 작성한 에세이가 사람 채점자에게 높은 점수를 받을 수준으로 평가된 사례도 확인됐다. 이런 결과는 기존 과제가 학생의 이해도나 사고력을 측정하는 도구로서 한계를 드러낸다.

평가 공정성 문제도 논쟁 대상이다. 인공지능 탐지 시스템은 문장 패턴을 기준으로 판단한다. 이 과정에서 비원어민 학생의 글이나 단순한 문장 구조를 인공지능이 만든 글로 잘못 판단하는 경우가 보고됐다. 실제로 학생이 작성한 글임에도 부정행위 의심을 받는 상황이 발생할 수 있다. 이런 오류는 학생의 평가 결과에 영향을 줄 수 있어 교육 현장에서 큰 논쟁을 불러온다.

이런 상황은 글쓰기 평가의 교육 목적에 대한 재검토로 이어진다. 인공지능은 정보 정리나 문장 작성 같은 작업을 빠르게 수행한다. 단순 결과물만 평가하는 방식으로는 학생이 어떤 사고 과정을 거쳤는지 확인하기 어렵다. 일부 교육기관에서는 수업 중 글쓰기, 개인 경험 기반 글쓰기, 프로젝트형 과제 같은 새로운 평가 방식을 시도하고 있다. 학생이 직접 사고하고 자료를 해석하는 과정을 확인하려는 시도다.

인공지능 확산은 학교 평가 체계 전체에도 변화를 요구한다. 글 결과만 평가하는 방식에서 벗어나 사고 과정, 자료 활용 방식, 토론 참여, 협업 활동 등을 함께 평가해야 한다는 의견이 늘고 있다. 글쓰기 평가는 단순 과제 채점에서 학습 과정 중심 평가로 이동하는 흐름에 놓여 있다. 교육 현장은 인공지능 기술 확산 속에서 새로운 평가 기준을 찾는 단계에 들어갔다.

FAQ

AI로 작성한 글은 학교에서 모두 부정행위로 간주되나요?
학교마다 정책이 다릅니다. 일부 학교는 전면 금지 방식을 사용합니다. 다른 학교는 참고 도구로 제한적 사용을 허용하기도 합니다.
AI 탐지 프로그램은 얼마나 정확한가요?
연구에 따르면 일부 탐지 시스템의 정확도는 80퍼센트 이하로 보고됩니다. 문장 수정만으로 탐지를 피하는 경우도 있습니다.
학교에서는 어떤 새로운 평가 방법을 시도하고 있나요?
수업 시간에 직접 작성하는 글쓰기, 개인 경험 기반 글쓰기, 장기 프로젝트 과제 같은 방식이 도입되는 사례가 있습니다.
앞으로 글쓰기 수업은 어떻게 바뀔 가능성이 있나요?
결과물 중심 평가보다 사고 과정, 자료 조사 과정, 토론 참여 등을 함께 평가하는 방식으로 이동할 가능성이 있습니다.
최지환

기술의 본질과 그 파급력을 깊이 있게 탐구하며, IT 산업 전반에 걸친 변화의 흐름을 날카롭게 짚어내는 데 집중하고 있습니다. 인공지능, 클라우드, 반도체, 사이버보안 등 빠르게 진화하는 분야에서 핵심 이슈를 선별하고, 일반 독자도 쉽게 이해할 수 있도록 맥락을 갖춘 보도를 지향합니다. 기술 자체보다는 그것이 산업과 사회에 어떻게 작용하는지를 관찰하고, 기업 전략, 기술 규제, 사용자 경험 등 다양한 관점에서 접근합니다. 각종 기술 행사와 컨퍼런스를 직접 취재하며, 깊이 있는 분석과 균형 잡힌 시각으로 독자의 신뢰를 쌓아가고 있습니다.

IT 관련 게시물

최근 게시물