복잡한 프로그래밍 작업에서 인간이 여전히 AI를 능가한다는 새로운 연구 결과가 나왔습니다.

October 30, 2023
1583 Views

Heliyon에 발표된 새로운 연구는 ChatGPT와 같은 인공지능 시스템이 모든 작업에서 인간의 능력과 비슷하거나 능가할 수 있다는 기존의 생각을 뒤집습니다. 연구원들은 IEEExtreme 프로그래밍 경진대회에서 프로그래밍 문제를 푸는 ChatGPT의 성능을 인간의 평균 점수와 비교하여 평가했습니다. 분석 결과, 상대적으로 복잡한 프로그래밍 문제에서는 여전히 인간 프로그래머가 ChatGPT를 훨씬 능가하는 것으로 나타났습니다.

이 연구는 과거 5번의 IEEExtreme 대회에서 출제된 102개의 프로그래밍 문제를 분석했으며, Python, Java 또는 C++로 솔루션을 만드는 문제가 포함되었습니다. 평균적으로 인간 프로그래머는 언어에 따라 ChatGPT보다 3.9배에서 5.8배 더 높은 점수를 받았습니다. 성능 차이는 고급 문제에서 가장 뚜렷하게 나타났습니다. 예를 들어, 고급 문제에서 ChatGPT의 점수는 쉬운 문제에 비해 23배 낮은 반면, 인간은 단지 2.4배 낮았습니다.

수석 연구원은 "우리의 경험적 분석은 인간 프로그래머가 프로그래밍 컨텍스트 내에서 문제 해결의 특정 측면에서 ChatGPT보다 경쟁 우위를 유지한다는 것을 보여줍니다."라고 설명했습니다. "이는 프로그래밍 작업을 위한 ChatGPT 및 기타 AI 언어 모델에서 개선할 수 있는 부분이 있음을 강조합니다."

이 연구에 따르면 ChatGPT는 자연어 처리, 간단한 프로그램 생성, 코드 문서화에서는 가능성을 보이지만, 고도의 추론 전문 지식이 필요한 복잡한 코딩 문제를 해결하는 데는 한계가 있는 것으로 나타났습니다. 이번 연구 결과는 숙련된 프로그래머처럼 코드를 이해하고 합리화할 수 있는 AI를 개발하기 위해서는 더 많은 연구가 필요하다는 것을 시사합니다.

"전반적으로 평균적인 인간 프로그래머들이 프로그래밍 과제에서 ChatGPT보다 우월하다는 것은 AI가 특정 특수한 상황에서 인간의 지능과 일치하기 위해서는 아직 많은 진전이 필요하다는 것을 보여줍니다."라고 결론지었습니다. "이는 특히 교육과 경험을 통해 인간이 뛰어난 능력을 발휘하는 복잡한 논리적 작업의 경우 더욱 두드러집니다."

연구진은 이 연구가 현대 AI 시스템의 강점과 약점에 대한 귀중한 시사점을 제공함으로써 향후 개발 방향을 제시한다고 말합니다. 이들의 연구는 인간과 인공지능 간의 상호작용에 대한 이해를 더욱 풍부하게 해줍니다.

논문보기