People are already using ChatGPT to create workout plans

챗GPT가 헬스 트레이너를 대체할 수 있을까

오픈AI의 대형 언어모델 챗GPT는 제법 인상적인 운동 조언을 제공하지만, 너무 진지하게 받아들이기엔 아직 위험해보인다.

필자는 런던 마라톤 대회의 참가가 승인되었다는 이메일을 받고 마음이 들떴지만 곧 훈련에 대한 두려움이 엄습했다. 지난번 참가한 대회에서 겨우 6개월이 지난 시점이었다. 런던의 비와 추위는 물론 피곤함, 변덕, 숙취를 이겨내고 몇 달간 하루도 빠짐없이 달리려면 대단한 헌신이 필요하다. 

누구도 마라톤 대회 자체는 쉬운 부분이라고 알려주지 않는다. 대회 전의 끊임없는 훈련이 죽을 만큼 힘들기 때문에 이 과정을 새롭고 흥미롭게 만들 수 있는 방법을 찾아야 한다. 

어떤 운동광들은 오픈AI(OpenAI)가 개발한 AI 챗봇, 챗GPT(ChatGPT)를 일종의 헬스 트레이너처럼 활용하면서 효과적인 방법을 찾았다고 생각한다. 챗GPT는 로맨틱한 시부터 법적인 문서까지 모든 자료를 대량으로 생성할 수 있다. 이제 운동광들은 힘든 러닝을 재미있게 만들기 위해 챗GPT를 활용한다. 심지어 챗GPT의 답변을 운동계획 상품으로 포장해 판매하는 일부 업자들도 생겨났다. 

챗GPT가 주는 이점은 명백하다. 어떤 질문도 수초 내로 빠르게 대답하기 때문에 인터넷에서 수많은 정보를 걸러낼 필요가 없다. 후속 질문을 이어가면 더 자세하고 개인화된 답변을 얻을 수도 있다. 챗GPT는 친근한 어조로 운동에 대한 조언을 제공하면서 모든 정보를 명확한 방식으로 제시한다. 오픈AI 측에서 자세한 내용은 함구하고 있지만, 챗GPT는 웹사이트, 위키피디아, 공개된 책 내용 등에서 끌어모은 데이터를 학습한다고 알려져 있다. 실제로 일반적인 질문에는 제법 훌륭한 대답을 내놓는 것처럼 보이기도 한다. 단, 모든 대답이 사실이라는 보장은 없다. 

그렇다면 챗GPT는 미래의 운동 방식에 새로운 변화를 가져올 수 있을까? 아니면 자신만만하게 헛소리를 내뱉는 기계에 불과할까? 

챗GPT로 계획 세우기

필자는 챗GPT를 시험하기 위해 16주간의 마라톤 훈련 계획을 세워 달라고 요청했다. 그러나 곧 효과가 없는 계획임을 알 수 있었다. 마라톤 훈련을 제대로 하려면 코스의 길이를 매주 조금씩 늘려가야 한다. 가장 긴 훈련 코스는 거의 20마일(약 32km)에 이르는 것이 정석이다. 그러나 챗GPT는 최대 10마일(약 16km)의 코스를 달릴 것을 추천했다. 준비가 부족한 상태에서 대회에 참여하면 어떻게 될지 상상만 해도 끔찍하다. 달리는 내내 고통에 시달릴 것이고 심각한 부상을 당할 위험도 있다. 

이어서 필자는 새로운 대화를 생성해 같은 질문을 던져보았다. 조금 전 대화와 다르게 챗GPT는 마라톤 대회 바로 전날에 19마일(약 31km)을 달리라고 제안했다. 역시 문제가 될 법한 운동계획이었다. 이 계획을 따른다면 대회 시작점에서 이미 지친 상태가 될 것이고 여전히 부상의 위험이 있다. 

필자는 챗GPT가 같은 질문에 다른 대답을 하는 이유를 이해할 수 없었고 오픈AI에 문의했다. 오픈AI의 대변인은 대형 언어모델은 질문마다 매번 다른 대답을 생성하는 경향이 있다고 설명했다. 그리고 “챗GPT는 데이터베이스가 아니기 때문에 질문이나 요청마다 새로운 대답을 생성하는 것”이라고 덧붙였다. 오픈AI 웹사이트에서는 챗GPT가 같은 대화 내에서는 전후 문답을 참고할 수 있지만 새로운 대화를 생성한 경우 과거의 대화 내용을 참고할 수는 없다고 명시하고 있다. 

이어서 챗GPT가 왜 유해한 조언을 제공하는지 묻자 대변인은 이렇게 답변했다. “이용자들은 챗GPT가 조사 결과를 미리 보여주는 정도에 불과하다는 사실을 알아야 한다. 우리는 챗GPT가 가끔은 잘못된 정보, 유해한 지시사항, 편향된 내용 등을 생성할 수 있다고 이용자들에게 미리 고지하고 있다.” 

필자는 이후에도 챗GPT에 여러 번 마라톤 훈련 계획을 요청했다. 그중 한 대답에서는 현명하게도 전문가의 확인을 거치라는 주의사항을 넣어주었다. 다른 대답에서는 몸의 상태를 잘 살피고 필요하면 휴식을 취하라고 말하기도 했다. 그러나 또 다른 대답에서는 어떤 주의사항도 없었다. 이 챗봇의 대답들은 일관성이 없는 데다 아무런 도움이 되지 않았다. 

결국 필자는 실망했고 동시에 다른 사람들이 걱정됐다. 챗GPT의 운동계획은 필자에게 전혀 도움이 되지 않았다. 그럼에도 불구하고 틱톡, 레딧, 트위터와 같은 소셜 미디어에서 수많은 사람이 챗GPT를 이용해 운동계획을 세우고 있었다. 그리고 그 계획을 그대로 따르고 있었다. 

챗GPT의 한계 시험

챗GPT의 운동에 대한 조언은 얼핏 보기에는 인상적이다. 미국 테네시주에 거주하는 운동광 오스틴 굿윈(Austin Goodwin)은 콘텐츠 마케터로 일하면서 우연히 이 방법을 접했다. 그는 일반적인 운동 관련 질문을 던지면서 챗GPT의 한계를 시험해 보기로 했다. 

굿윈은 웨이트 트레이닝에서 점진적 과부하(progressive overload, 들어 올리는 무게나 반복 횟수를 조금씩 증가시키는 것)가 무엇인지, 그리고 체중 감량을 위해 왜 칼로리를 줄여야 하는지 챗GPT에 질문했다. 그는 챗GPT의 대답을 “다년간의 운동 지식을 가진 사람에게서 기대할 만한 수준”이라고 평가했다. 이어서 “구글이나 위키피디아에 스테로이드를 검색하는 것과 비슷한데, 챗GPT는 그 검색 결과를 자세히 진술하면서 정보의 품질을 한 단계 높이는 역할을 하는 것 같다”라고 덧붙였다. 

구글 검색의 경쟁자로서 챗GPT의 잠재력을 본 사람은 굿윈만이 아니다. 소문에 의하면 구글의 경영진도 ‘코드 레드(code red)’ 급의 위협이라고 언급했다고 한다. 

필자는 이번에는 챗GPT에 웨이트 트레이닝 계획을 요청하면서 이 챗봇이 사람들의 실제 경험에 기반한 정보를 얼마나 잘 제공하는지 알게 되었다. (순전히 이론적인 목적이며 AI의 제안을 따를 생각은 전혀 없음을 밝힌다.) 챗GPT는 스쿼트, 풀업, 런지로 구성된 일상적인 운동 방식을 제안했다. 필자는 챗GPT의 한계를 시험하기 위해 살을 빼려면 어떻게 해야 되냐고 물었다. (기자로서 책무를 다하기 위해 다시 거짓말을 하고 말았다.) 챗GPT는 “살을 빼려면 식단에 신경을 써야 한다”는 조언과 함께 식단과 관련된 인상적인 주의사항을 전달했다. 여기까지의 대답은 틀린 부분 없이 정확했다. 

굿윈은 자신이 이미 답을 알고 있는 질문으로 챗GPT의 한계를 시험하고 있다. 이어서 알렉스 코헨(Alex Cohen)의 이야기도 들어보자. 그는 헬스케어 스타트업 카본헬스(Carbon Health)에서 일하고 있으며 역시 운동을 즐기는 사람이다. 

코헨은 1일 에너지 소비량(TDEE)을 계산해 달라는 질문으로 챗GPT를 이용하기 시작했다. 참고로, 1일 에너지 소비량은 한 사람이 하루에 소모하는 총 칼로리 수치다. 체중을 줄이거나, 유지하거나, 또는 늘리기 위해 어느 정도의 칼로리를 소모해야 하는지 추정하는데 유용하다. 그리고 식단 예시 및 운동계획도 제공해 달라고 요청했다. 코헨은 처음에는 굿윈과 마찬가지로 챗GPT의 정보 제공 방식에 강렬한 인상을 받았다. 그러나 곧 챗GPT가 영양사나 헬스 트레이너를 대체할 수 없음을 깨닫는다. 

“내 구체적인 체형과 근육의 발달 상태, 운동 경험을 바탕으로 한 개인화된 정보가 아니었다”라며 코헨은 실망을 내비쳤다. 챗GPT는 이용자에게 대답을 개선할 수 있는 추가적인 질문을 하지 않는다. 

헬스장으로 진출한 챗GPT

챗GPT의 오락가락한 대답에도 불구하고 헬스장에서 많은 사람들이 그 조언을 따라 운동하고 있다. 

미국에 거주하는 틱톡 콘텐츠 크리에이터 존 유(John Yu)는 챗GPT가 제공한 6일간의 전신 운동 프로그램을 수행하며 영상을 촬영했다. 그는 매일 챗GPT에게 팔, 다리 등 그날 단련하고 싶은 부위의 운동방법을 알려 달라고 요청하고 그 대답에 따라 운동했다. 

챗GPT가 제안한 운동들은 완벽히 훌륭했고 따라 하기도 쉬웠다. 그러나 존 유는 동작의 다양성이 떨어진다는 사실을 발견했다. 그는 “챗GPT의 제안을 곧이곧대로 따르고 싶지 않다”라고 덧붙였다 

호주에 거주하는 바디빌딩 콘텐츠 크리에이터 리 램(Lee Lem)도 비슷한 경험을 했다. 램은 챗GPT에 ‘최적의 다리 운동’ 일일 프로그램을 만들어 달라고 요청했다. 챗GPT는 스쿼트, 런지, 데드리프트 등 일련의 효과적인 운동을 제안했지만 각 운동 사이의 휴식 시간이 너무 짧았다. 램은 “이대로면 너무 힘들지 않은가!”라고 웃으며 “스쿼트 세트 사이에 단 30초만 쉬는 것은 비현실적”이라고 말했다. 

램은 챗GPT의 중요한 문제점을 알 수 있었다. 바로 인간의 몸을 고려하지 않는다는 것이다. 두 사람이 깨달은 것처럼 사람은 같은 운동을 반복하면 금방 지루해지거나 지치게 된다. 실제 전문가들은 다양한 종류의 운동을 결합해야 한다는 사실을 안다. 그러나 챗GPT는 정보를 최대한 명시적으로 전달해야 하므로 다양성이 비교적 떨어진다. 

어떤 사람들은 AI의 운동계획을 여전히 매력적이라고 생각하고 기꺼이 비용을 지불하기도 한다. 영국 런던에 거주하는 소프트웨어 엔지니어 아흐메드 마이어(Ahmed Mire)는 챗GPT로 제작한 운동계획을 개당 15달러(약 1만 8,000 원)에 판매한다. 사람들이 자신의 운동 목표와 세부사항을 마이어에게 전달하면 그가 챗GPT를 이용해 운동계획을 제공하는 방식이다. 마이어는 지난달 서비스를 론칭한 이후 가입 고객들이 늘고 있고 식단계획 옵션 추가도 고려하고 있다고 한다. 챗GPT는 누구나 무료로 이용할 수 있지만 편의를 위해 비용을 지불하는 사람들도 있다고 그는 설명했다. 

필자가 지금까지 본문에서 언급한 몇 사람들은 챗GPT의 제안을 진지한 운동 가이드로 받아들이지 않았다. 그보다 흥미로운 실험 정도로 생각하고 있었다. 그들은 챗GPT의 취약점을 짚어낼 수 있을 정도로 운동에 대한 충분한 지식이 있고 무슨 운동이 효과가 있거나 없는지 잘 아는 사람들이다. 게다가 그들 모두가 이미 챗GPT의 제안에 회의적인 관점을 가지고 있었다. 그러나 운동을 처음 시작하는 사람들의 경우 그 제안을 있는 그대로 받아들일 수 있다. 

AI 모델과 운동의 미래

지금까지의 이야기는 AI 모델이 운동계획을 세울 수 없거나, 세워서는 안 된다는 뜻이 아니다. 하지만 완전히 믿을 수는 없음을 알려준다. 앞으로 챗GPT는 개선될 것이고 스스로 질문하는 방법도 배울 것이다. 이용자가 싫어하는 운동이 있는지, 소소한 부상이 있는지 등의 질문을 던질지도 모른다. 본질적으로 챗GPT는 독창적인 제안을 할 수 없고 반복에 대한 기본적인 개념이 없다. 

영국 켄트 대학교에서 AI를 가르치는 필리프 드 와일드(Philippe De Wilde) 교수는 챗GPT가 인터넷 데이터로 학습했기 때문에 주로 다수의 사람들이 아는 정보를 제공한다고 지적했다. 챗GPT의 대답이 기술적으로는 옳을지라도 인간 전문가가 내놓은 결과를 뛰어넘지는 못할 것이다. 

챗GPT를 유용하게 사용하는 방법이 있다. 자신의 운동 방식이 진부하게 느껴질 때 살짝 양념을 가미해 재미를 주는 수단으로, 또는 우리가 스스로 생각하지 못하는 운동 아이디어를 얻어 시간을 절약할 수 있는 수단으로 활용하는 것이다. “챗GPT는 수단에 불과하며 절대적인 진리가 아니다” 영국의 스포츠·운동의학 고문의사 레베카 로빈슨(Rebecca Robinson)은 말한다. 

필자는 인터넷에서 벗어나 러닝 전문가들이 저술한 책과 잡지 기사를 참고해 마라톤 훈련 계획을 세웠고 4주 만에 제법 좋은 성과가 나타났다. 

챗GPT의 조언을 받아들이지 않는 사람은 필자만이 아니다. 리 램은 영상을 찍기 위해 챗GPT를 이용했다고 밝혔고, 존 유는 이제 AI는 없지만 더 즐겁게 할 수 있는 기존의 운동 방식으로 돌아갔다고 말했다. 존 유는 “챗GPT에 더 많은 정보를 주려고 애쓰면서 재미없는 운동을 하는 것보다 기존의 운동 방식을 고수하고 스스로 수정하는 편이 낫다”라고 덧붙였다.

미리보기 2회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.