ClOr

ClOr

백엔드 실무 트러블슈팅과 AI 에이전트 구조 분석을 기록합니다.

Claude Code 해부학 (완결)

51만 줄 소스코드를 19편에 걸쳐 분석한 완결 시리즈

전체 시리즈 보기 →

백엔드 트러블슈팅

실무에서 겪은 장애와 해결 과정 기록

전체 시리즈 보기 →

최신 글

AI 챗봇 비교 글은 넘치는데, 대부분 스펙표 복붙이거나 "다 좋아요~" 식이다. 실제로 3개를 유료 플랜으로 쓰면서 같은 작업을 시켜본 글은 생각보다 드물다.

나는 현업 개발자다. Claude Pro, ChatGPT Plus, Gemini Advanced를 전부 결제해서 쓰고 있다. 월 $60이 나간다. 아깝긴 한데, 덕분에 확실히 비교할 수 있게 됐다. 이 글은 그 비교 기록이다. 마케팅이 아니라 내가 직접 쓰면서 느낀 차이를 적는다. 개발자 시점이 메인이지만, 일반 사용 케이스도 포함했다.

결론부터 말하면 — 만능은 없다. 상황별 최적해가 다르다. 근데 그 "상황별 최적해"가 뭔지를 구체적으로 아는 게 중요하다.

목차

  • 비교 기준
  • 한눈에 비교표
  • 코딩: 클로드 AI 압승
    • 같은 요청을 던져봤다
    • Claude Code라는 킬러 기능
    • 복잡한 구조에서 차이가 벌어진다
  • 글쓰기: 취향 차이지만 패턴은 있다
    • Claude: 간결하고 정보 밀도가 높다
    • ChatGPT: 유려하고 설득력 있다
    • Gemini: 무난하지만 개성이 없다
    • 용도별 정리
  • 한국어 능력: 미묘하지만 차이가 있다
    • 존댓말/반말 전환
    • 번역 투 문제
    • 한국 문화 맥락
  • 멀티모달: 이미지와 파일 처리
    • 이미지 생성: Claude의 가장 큰 약점
    • 이미지 분석: 비슷하다
    • PDF / 문서 분석: Claude가 약간 앞선다
  • 웹 검색: Gemini의 홈그라운드
    • Gemini: 구글 검색 네이티브 통합
    • ChatGPT: Bing 기반 검색
    • Claude: 제한적 검색
  • 어떤 상황에 어떤 걸 쓰나: 실전 가이드
    • 그래서 나는 이렇게 쓴다
  • 자주 묻는 질문
    • 하나만 골라야 한다면?
    • 무료 버전은 어떤가?
    • 앞으로는 어떻게 될까?
  • 결론: 정답은 "상황에 따라"

비교 기준

  • 3개 전부 유료 플랜 기준이다. 무료 버전끼리 비교하면 의미가 없다. Claude Pro($20/월), ChatGPT Plus($20/월), Gemini Advanced($20/월).
  • 같은 작업을 시켜봤다. 코딩, 글쓰기, 번역, 문서 요약, 한국어 대화 등을 동일한 프롬프트로 테스트했다.
  • 개발자 시점이 메인이지만 일반 사용도 포함했다. 이미지 생성, 웹 검색, 일상 질문 같은 것도 비교했다.

한눈에 비교표

먼저 스펙을 한 장으로 정리한다. 2026년 4월 기준이다.

항목 클로드 AI (Opus 4.6) ChatGPT (GPT-4o) Gemini (2.5 Pro)
가격 $20/월 $20/월 $20/월
코딩 능력 최강 강함 좋음
글쓰기 자연스러움 약간 과장 경향 무난
한국어 좋음 좋음 좋음
컨텍스트 창 200K (최대 1M) 128K 1M
이미지 생성 불가 DALL-E 3 Imagen
웹 검색 제한적 가능 네이티브
파일 분석 강함 강함 강함
코딩 전용 CLI Claude Code 없음 (Codex는 별도) 없음

표만 보면 비슷해 보이는데, 실제로 써보면 체감이 꽤 다르다. 하나씩 뜯어보자.

코딩: 클로드 AI 압승

솔직히 코딩에서 클로드 AI(Claude)를 이길 수 있는 모델은 지금 시점에서 없다. 이건 팬심이 아니라 실제 결과로 나온 거다.

같은 요청을 던져봤다

세 모델에 동일한 프롬프트를 줬다: "React에서 여러 API를 호출하는 컴포넌트를 리팩토링해줘. 현재 useEffect에서 3개의 API를 직접 호출하고, 로딩/에러 상태도 각각 관리하고 있어."

Claude (Opus 4.6)의 결과:

  • 커스텀 훅 useApiQuery를 만들어서 공통 로직을 추출했다
  • 로딩/에러 상태를 하나의 상태 머신으로 통합했다
  • 에러 바운더리 패턴까지 제안했다
  • 코드량이 40% 줄었고, 테스트하기도 쉬운 구조였다

ChatGPT (GPT-4o)의 결과:

  • 커스텀 훅을 만들긴 했는데, 각 API마다 별도 훅을 만들었다
  • 코드 자체는 정확한데 "왜 이렇게 나눴는지" 아키텍처 판단이 약했다
  • 타입 정의가 좀 느슨했다 — any가 두 군데 섞여 있었다

Gemini (2.5 Pro)의 결과:

  • 리팩토링은 했는데 구조가 기존이랑 크게 달라지지 않았다
  • React Query(TanStack Query) 도입을 제안했는데, 그건 "리팩토링"이 아니라 "라이브러리 교체"다
  • 설명은 길고 친절한데 핵심을 비켜간 느낌이었다

Claude Code라는 킬러 기능

클로드 AI의 진짜 무기는 Claude Code다. 터미널에서 직접 코딩을 시킬 수 있는 전용 CLI인데, 이건 ChatGPT에도 Gemini에도 없다.

$ claude
> 이 프로젝트의 테스트 커버리지가 낮은 파일을 찾아서 테스트를 추가해줘

이러면 Claude가 프로젝트 구조를 파악하고, 커버리지를 확인하고, 테스트를 작성하고, 실행까지 한다. 채팅창에 코드를 복붙하는 게 아니라 내 프로젝트 안에서 직접 작업한다. 파일을 읽고, 수정하고, 터미널 명령을 실행하고, 결과를 확인하고, 문제가 있으면 고친다.

ChatGPT의 Codex CLI가 있긴 하지만, Claude Code만큼 성숙하지 않다. Gemini는 이런 도구 자체가 없다. 개발자라면 이것 하나만으로도 클로드를 선택할 이유가 충분하다.

복잡한 구조에서 차이가 벌어진다

간단한 코드 — 정렬 알고리즘 구현, 유틸 함수 작성 — 에서는 세 모델 다 잘한다. 차이가 나는 건 복잡한 구조에서다.

  • 멀티 파일 리팩토링: Claude는 파일 간 의존성을 정확히 추적한다. ChatGPT는 가끔 import를 빠뜨린다.
  • 에러 핸들링 설계: Claude는 에러 시나리오를 먼저 생각하고 방어 코드를 넣는다. ChatGPT는 해피 패스 위주로 짜고 에러 처리는 나중에 추가하는 경향이 있다.
  • 코드 일관성: 긴 대화에서 Claude는 처음에 정한 패턴을 끝까지 유지한다. ChatGPT는 대화가 길어지면 스타일이 바뀌기도 한다.

코딩 영역 결론: Claude >> ChatGPT > Gemini. 특히 Claude Code를 쓰면 격차가 더 벌어진다.

글쓰기: 취향 차이지만 패턴은 있다

코딩과 달리 글쓰기는 "객관적 우위"를 말하기 어렵다. 그래도 각 모델마다 뚜렷한 경향이 있다.

Claude: 간결하고 정보 밀도가 높다

Claude가 쓰는 글은 군더더기가 없다. 필요한 말만 하고 끝낸다. 과장이 없고, "~할 수 있습니다!" 같은 뻔한 표현을 잘 안 쓴다. 개발자가 읽기에 편한 문체다.

다만 가끔 너무 건조하다는 느낌이 들 때가 있다. 감성적인 글이나 마케팅 카피를 쓰라고 하면 좀 밋밋하게 나온다.

ChatGPT: 유려하고 설득력 있다

ChatGPT는 글을 쓴다. 문장의 흐름이 자연스럽고, 설득력이 있다. 마케팅 카피, 이메일, 발표 자료 같은 데서 특히 강하다.

문제는 과잉 친절이다. "정말 좋은 질문이세요!" "물론이죠!" "

하면 정말 좋을 것 같아요!" 이런 표현이 계속 나온다. 한 번 지우라고 하면 줄이는데, 다음 답변에서 또 나온다. 그리고 "

입니다" "~있습니다" 반복이 심한 편이다.

또 하나, ChatGPT는 길이 조절이 좀 안 된다. "짧게 써줘"라고 해도 긴 편이다. Claude는 "짧게"라고 하면 진짜 짧게 쓴다.

Gemini: 무난하지만 개성이 없다

Gemini는 글쓰기에서 특별히 뛰어나지도, 특별히 나쁘지도 않다. 무난하다. 그게 장점이자 단점이다.

가끔 사실 관계가 부정확한 경우가 있어서, Gemini가 쓴 글은 팩트 체크를 한 번 더 해야 한다. 특히 한국 관련 정보에서 이런 경향이 있다.

용도별 정리

  • 기술 블로그 / 문서 → Claude. 정확하고 간결하다.
  • 마케팅 카피 / 이메일 → ChatGPT. 설득력 있고 유려하다.
  • 긴 문서 요약 → Gemini. 핵심을 잘 뽑는다.
  • 보고서 / 제안서 → Claude 또는 ChatGPT. 둘 다 잘한다.

한국어 능력: 미묘하지만 차이가 있다

2026년 기준으로 세 모델 다 한국어를 잘한다. 2023년만 해도 "한국어 되나요?"가 질문이었는데, 지금은 3개 다 유창하다. 하지만 미묘한 차이가 있다.

존댓말/반말 전환

Claude가 가장 자연스럽다. "이 글을 반말로 바꿔줘"라고 하면 전체 톤을 일관되게 전환한다. "

거든", "

잖아", "~거다" 같은 반말 어미를 자연스럽게 섞는다.

ChatGPT도 잘하는데, 가끔 존댓말과 반말이 섞이는 경우가 있다. 한 단락 안에서 "

합니다"와 "

한다"가 공존하는 식이다.

Gemini는 반말 자체는 잘하는데, 너무 딱딱한 반말이 될 때가 있다. 자연스러운 구어체보다는 번역 투에 가까운 느낌이다.

번역 투 문제

ChatGPT는 가끔 영어 문장 구조를 그대로 한국어로 옮긴 듯한 문장을 만든다. "그것은 매우 중요한 사실인데, 왜냐하면~" 같은 식이다. 한국어에서는 자연스럽지 않은 구조다.

Claude는 이런 번역 투가 거의 없다. 한국어 네이티브가 쓴 것처럼 나온다.

한국 문화 맥락

Gemini가 가끔 한국 문화 맥락을 놓친다. 예를 들어 "회식 문화에 대해 설명해줘"라고 하면, Gemini는 일반적인 "직장 저녁 식사" 정도로 설명하고 2차, 3차 문화나 상사 눈치 같은 미묘한 뉘앙스를 빠뜨리기도 한다.

Claude와 ChatGPT는 이런 부분에서 더 정확하다. 한국어 학습 데이터의 양과 질 차이가 아닐까 추측한다.

한국어 결론: Claude ≥ ChatGPT > Gemini. 근데 솔직히 일상 대화 수준에서는 세 개 다 충분하다. 차이가 나는 건 긴 글 작성이나 미묘한 톤 조절이 필요한 경우다.

멀티모달: 이미지와 파일 처리

이미지 생성: Claude의 가장 큰 약점

ChatGPT (DALL-E 3) > Gemini (Imagen) >>> Claude (불가)

Claude는 이미지를 생성할 수 없다. 이건 2026년 4월 현재도 마찬가지다. 솔직히 이게 클로드의 가장 큰 약점이다.

ChatGPT의 DALL-E 3는 이미지 생성 퀄리티가 꽤 좋다. 프롬프트 해석도 정확하고, 텍스트가 포함된 이미지도 비교적 잘 만든다. Gemini의 Imagen도 괜찮은데, ChatGPT보다는 한 단계 아래라는 게 체감이다.

블로그 썸네일이나 프레젠테이션 이미지가 필요할 때, Claude한테는 아예 부탁을 못 한다. 이 하나 때문에 ChatGPT를 해지 못 하는 사람이 꽤 있을 거다.

이미지 분석: 비슷하다

스크린샷을 주고 "이 UI에서 뭐가 문제야?"라고 물어보면, 세 모델 다 비슷하게 잘 분석한다. 코드 스크린샷 분석, 에러 메시지 해석, 다이어그램 이해 — 이 영역에서는 유의미한 차이를 못 느꼈다.

PDF / 문서 분석: Claude가 약간 앞선다

Claude ≥ ChatGPT > Gemini

Claude는 200K 컨텍스트(확장 시 1M)를 제공하는데, 긴 문서를 통째로 넣고 분석할 때 이게 체감된다. 100페이지짜리 기술 문서를 넣고 "이 시스템의 아키텍처를 요약해줘"라고 하면, Claude가 가장 정확하게 구조를 파악한다.

Gemini도 1M 컨텍스트를 제공하지만, 긴 문서에서 핵심을 뽑아내는 능력은 Claude보다 살짝 떨어진다. 길게 넣을 수 있다는 것과 그걸 잘 이해한다는 건 별개의 문제다.

ChatGPT는 128K로 컨텍스트가 가장 짧지만, 그 안에서의 분석 능력은 Claude와 비슷하다.

웹 검색: Gemini의 홈그라운드

이건 Gemini가 압도적으로 앞선다.

Gemini > ChatGPT >> Claude

Gemini: 구글 검색 네이티브 통합

Gemini는 구글 검색이 네이티브로 통합되어 있다. 질문에 최신 정보가 필요하면 자동으로 검색하고, 검색 결과를 답변에 녹여낸다. 출처도 달아준다.

"오늘 삼성전자 주가 어때?" "최근 Next.js 업데이트 내용 알려줘" 같은 질문에 Gemini가 가장 빠르고 정확하게 답한다.

ChatGPT: Bing 기반 검색

ChatGPT도 웹 검색이 가능하다. Bing 기반이라 구글만큼 폭넓지는 않지만, 충분히 쓸 만하다. 다만 가끔 검색 결과가 좀 오래된 페이지를 가져올 때가 있다.

Claude: 제한적 검색

Claude는 웹 검색 기능이 제한적이다. 이건 클로드의 두 번째 큰 약점이다. 최신 정보가 필요한 질문에는 Claude가 가장 취약하다. 학습 데이터 이후의 정보는 대답을 못 하거나 부정확하게 대답한다.

실시간 정보가 필요한 작업 — 최신 뉴스, 실시간 데이터, 방금 나온 라이브러리 문서 — 에서는 Gemini나 ChatGPT를 쓰는 게 맞다.

어떤 상황에 어떤 걸 쓰나: 실전 가이드

이론은 됐고, 실전에서 어떻게 쓰는지를 정리한다. 이건 내가 실제로 따르는 기준이다.

상황 추천 이유
코딩 / 개발 클로드 AI 코드 품질 최고 + Claude Code
긴 문서 분석 클로드 AI 200K~1M 컨텍스트 + 정확한 분석
이미지 생성 ChatGPT DALL-E 3, 유일하게 제대로 됨
실시간 정보 검색 Gemini 구글 검색 네이티브
블로그 / 기술 문서 작성 클로드 AI 간결하고 정확한 문체
마케팅 카피 / 이메일 ChatGPT 설득력 있는 문체
일상 대화 / 간단한 질문 아무거나 셋 다 잘함
코드 리뷰 클로드 AI 아키텍처 판단이 정확
번역 (영→한) 클로드 AI 번역 투가 가장 적음
데이터 분석 ChatGPT 또는 Gemini Code Interpreter + 시각화
브레인스토밍 ChatGPT 아이디어 발산에 강함

그래서 나는 이렇게 쓴다

  • 메인: 클로드 AI (Pro + Claude Code). 코딩, 글쓰기, 문서 분석의 80%를 여기서 처리한다.
  • 서브: ChatGPT Plus. 이미지가 필요할 때, 마케팅 문구가 필요할 때, 브레인스토밍할 때 쓴다.
  • 가끔: Gemini Advanced. 최신 정보 검색이 필요하거나, 유튜브 영상 요약이 필요할 때 쓴다.

월 $60이 아깝냐고? 솔직히 아깝다. 근데 생산성 향상을 생각하면 투자 대비 수익이 확실히 있다. 특히 Claude Code로 코딩 시간이 반 이상 줄었다. 그 시간을 돈으로 환산하면 $60은 싸다.

자주 묻는 질문

하나만 골라야 한다면?

개발자라면 클로드 AI. Claude Code가 게임체인저다. 코딩 도구로서의 가치가 다른 모든 단점을 상쇄한다.

비개발자라면 ChatGPT. 가장 범용적이다. 글쓰기, 이미지 생성, 검색, 코딩 보조 — 뭘 시켜도 중간 이상은 한다. "하나만 있으면 뭐든 할 수 있는" 도구에 가장 가깝다.

무료 버전은 어떤가?

무료 버전끼리 비교하면 ChatGPT 무료가 가장 쓸 만하다. Claude 무료는 사용량 제한이 빡빡하고, Gemini 무료는 모델 성능이 확 떨어진다.

근데 무료 버전으로 AI를 판단하지 마라. 유료 전환하면 체감이 완전히 다르다. 특히 Claude는 Pro 플랜에서 Opus 모델을 쓸 수 있는데, 무료의 Sonnet과는 차원이 다르다.

앞으로는 어떻게 될까?

예측은 의미 없다. 6개월 전만 해도 이 비교 결과가 달랐을 거다. AI 발전 속도가 너무 빨라서, 이 글도 몇 달 뒤면 업데이트가 필요할 수 있다.

다만 확실한 건, 경쟁이 소비자에게 이롭다는 거다. 3개가 치열하게 경쟁하니까 가격은 비슷하게 유지되면서 성능은 계속 올라간다. 좋은 시대다.

결론: 정답은 "상황에 따라"

세 줄로 요약하면 이렇다:

  1. 코딩/개발자 → 클로드 AI. Claude Code가 결정적이다.
  2. 범용/크리에이티브 → ChatGPT. 이미지 생성 + 설득력 있는 글쓰기.
  3. 검색+최신 정보 → Gemini. 구글 검색 네이티브가 강력하다.

"가장 좋은 AI"는 없다. "내 상황에 가장 맞는 AI"가 있을 뿐이다. 이 글이 그 판단에 도움이 됐으면 좋겠다.


관련글:

profile

ClOr

@ClOr

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!

ClOr · 백엔드 트러블슈팅과 AI 에이전트 구조 분석을 기록합니다.