뉴스 이미지

국내 AI 모델들이 수능 수학을 풀어봤는데, 솔직히 결과가 엄청 안 좋음. 해외 AI 모델들이 76점부터 92점까지 받은 반면, 국내 모델들은 대부분 20점대, 심지어 2점짜리도 있었음. 업스테이지 솔라 프로-2가 그나마 58점 받은 게 최고점이었음.

이번 실험은 서강대 김종락 교수팀에서 국내 AI 5개 팀 모델과 해외 AI 5개 모델을 비교한 건데, 수능 문제랑 대학 논술 문제로 테스트했음. 파이썬 툴까지 써서 문제 풀이 적중률을 높여봤는데도 이 정도라니… 진짜 체감 난이도 제대로네. 엔트로피매스라는 자체 문제 세트로도 테스트했는데, 결과는 마찬가지였음.

아직 공개된 버전 모델들이라, 국가대표 AI 버전 나오면 다시 테스트해 볼 거라고 하니 좀 더 지켜봐야겠지?