🎉 34기 사전알림 신청(2/23 모집 예정)
AI & 생산성 · · 10 min read

OpenAI 프로덕트 리더가 말하는 AI 시대의 새로운 개발 표준: CC/CD (그리고 Eval 설계법)

AI 제품 개발, 왜 기존 방식으로는 실패할까? 히든 플레이북이 정리한 CC/CD 프레임워크로 AI 모델의 불확실성을 통제하는 실전 가이드를 확인하세요.

OpenAI 프로덕트 리더가 말하는 AI 시대의 새로운 개발 표준: CC/CD (그리고 Eval 설계법)

 데모를 만드는 데는 5분이면 충분하지만, 실전에 배포 가능한 수준의 AI 제품을 만드는 데는 5개월이 걸려도 모자랄 때가 많습니다.

그 이유는 우리가 그동안 익숙했던 소프트웨어 개발 방식이 AI 시대에는 더 이상 통하지 않기 때문입니다.

OpenAI의 제품 리더인 미셸 포크래스(Michelle Pokrass)는 이를 해결하기 위해 CC/CD(Continuous Creation & Continuous Control)라는 새로운 개발 프레임워크를 제시합니다. 전통적인 CI/CD가 코드의 안정성을 보장했다면, CC/CD는 모델의 불확실성을 통제하고 품질을 상향 평준화하는 핵심 엔진입니다.

왜 기존 방식이 무너지고 있는지, 그리고 2026년의 AI 팀은 어떤 루프 속에서 제품을 깎아내야 하는지 그 디테일한 가이드를 정리했습니다.

 

1. 기존 CI/CD의 몰락: 왜 '기획-개발-테스트' 순서가 먹히지 않는가?

전통적인 소프트웨어 개발은 '결정론적(Deterministic)'입니다.

A를 입력하면 반드시 B가 나와야 하고, 이를 코드로 구현한 뒤 테스트 케이스를 통과하면 배포합니다. 하지만 LLM 제품은 ‘확률적(Probabilistic)’입니다. 똑같은 프롬프트를 넣어도 매번 결과가 미묘하게 달라집니다.

이런 특성 때문에 기존 방식대로 접근하면 다음과 같은 치명적인 병목 현상이 발생합니다.

2. Continuous Development (CD): 성능의 정의와 구축

AI 제품 개발의 첫 단계는 코딩이 아니라 ‘정답의 기준’을 세우는 것입니다.

이를 위한 3단계 프로세스는 다음과 같습니다. 

Step 1. 성능 범위 확정 및 데이터 큐레이션 (Scope capability and curate data)

먼저 우리 AI가 '어디까지 할 수 있는지' 경계를 정해야 합니다. 이 단계의 결과물은 기획서가 아니라 골든 데이터셋(Golden Dataset)입니다.

Step 2. 애플리케이션 설정 (Set up application)

준비된 데이터를 바탕으로 실제 구동 환경을 세팅합니다.

Step 3. Eval 설계 (Design evals)

애플리케이션이 얼마나 잘 작동하는지 측정할 '자'를 만듭니다.

3. Transition: 배포는 '끝'이 아닌 '시작'

모든 준비가 끝났다면 이제 실전 배포(Deploy)입니다. 하지만 명심하세요. AI 제품에서 배포는 완료가 아니라, 실제 환경에서의 데이터 루프가 시작됨을 의미합니다. 

4. Continuous Control (CC): 실전과 개선의 무한 루프

배포된 모델이 현장에서 어떻게 작동하는지 끊임없이 통제하고 개선하는 과정입니다.

Step 4. Eval 실행 (Run evals)

배포된 모델이 실제 환경에서 내놓는 결과물을 지속적으로 모니터링합니다.

Step 5. 동작 분석 및 실패 패턴 식별 (Analyze behavior and spot error patterns)

데이터가 쌓이면 모델의 '취약점'이 보이기 시작합니다.

Step 6. 수정사항 적용 (Apply fixes)

식별된 패턴을 해결하기 위한 조치를 취합니다.

Part 4. 실전 사례: AI 고객 지원(Customer Support) 루프

이 복잡한 과정이 실제로는 어떻게 작동할까요?

'고객 지원 챗봇' 사례에 대입해 보겠습니다.

2026년의 빌더들이 가져야 할 태도

이제 AI 제품의 퀄리티는 엔지니어의 코딩 실력보다 ‘얼마나 정교한 CC/CD 루프를 가지고 있는가’에 의해 결정됩니다.

단순히 좋은 모델을 쓴다고 해서 제품이 완성되지 않습니다. 불확실성을 인정하고, 이를 통제 가능한 데이터로 바꾸는 시스템을 만드세요.

로우 데이터에서 실패 패턴을 찾아내고, 이를 다시 Eval 시스템에 녹여내는 그 ‘순환의 속도’가 2026년 테크 씬에서 살아남는 유일한 방법입니다.

💡
해당 글은 AI, 프로덕트, 그로스에 대해 다루는
<히든 플레이북>에 발행한 뉴스레터를 재발행한 글입니다.

더 많은 위 주제에 대한 아티블을 읽고 싶다면,
EO 플래닛에서 <히든 플레이북>을 검색해주세요! :)

Read next

엑셀 자동화로 반복 업무 하나 줄이기
AI & 생산성 ·

엑셀 자동화로 반복 업무 하나 줄이기

매번 주문이 들어올 때마다 복사하고 붙여넣고, 계산하고, 문서를 만들고 있나요? 이 글에서는 엑셀로 이런 반복 작업을 줄이는 가장 작은 자동화 방법을 실제 실습으로 정리했습니다. 복사 붙여넣기 5분에서 1분으로 줄이는 과정을 따라가 볼 수 있습니다.

💌 뉴스레터 구독