이중 용도(Dual-Use) 위험 — 사이버(Cyber), 생물(Bio), 화학(Chem), 핵(Nuclear) 영역의 역량 상승

2026년의 이중 용도(dual-use) 그림을 네 영역으로 나누어 살펴봅니다. 생물(bio)/화학(chem) 영역에서는 17강이 WMDP를 다루고, Anthropic의 생물무기 획득(bioweapon-acquisition) 실험에서 관찰된 2.53배 역량 상승(uplift)과 OpenAI의 2025년 4월 Preparedness Framework v2 경고("초보자가 알려진 생물학적 위협을 만들도록 의미 있게 도울 수 있는 문턱에 있음")가 변곡점을 표시합니다. 사이버 영역에서는 2025년 11월 Anthropic 보고서가 결정적입니다. 중국 연계 국가 행위자가 Claude의 에이전트형 코딩 도구(agentic coding tool)를 사용해 사이버 공격 캠페인의 최대 90%까지를 자동화했고, 사람의 개입은 4~6단계에만 필요했습니다. OpenAI의 신뢰 접근(trusted access) 파일럿은 검증된 보안 조직에 방어 목적의 이중 용도 작업을 위한 역량 접근을 제공합니다. 화학/생물 실행 격차(execution gap)도 줄어들고 있습니다. 고전적 방어 논리는 "정보 접근만으로는 충분하지 않다"였지만, 비전 지원 프런티어 모델(GPT-5.2, Gemini 3 Pro, Claude Opus 4.5, Grok 4.1)이 습식 실험실(wet-lab) 영상을 관찰하고 실시간으로 교정을 제공할 수 있게 되었습니다. 2025년 12월 OpenAI는 GPT-5가 습식 실험을 반복 개선하며 AI 기반 프로토콜 최적화로 79배의 효율 향상을 달성하는 모습을 시연했습니다. 또한 초보자(novice)와 전문가(expert)에게 작용하는 방식이 다릅니다. AI는 초보자에게 더 큰 상대적(relative) 역량 상승을, 전문가에게는 더 큰 절대적(absolute) 역량을 제공합니다.

유형: Learn 언어: 없음 선수 지식: Phase 18 · 17강(WMDP), Phase 18 · 18강(안전 프레임워크), Phase 18 · 28강(생태계) 예상 시간: 약 75분

학습 목표

  • 2024~2025년 생물 영역 역량 상승 서사를 설명합니다. 즉 "약한 역량 상승(mild uplift)" → "문턱에 있음(on the cusp)" → "ASL-3을 배제하기에 부족한 2.53배 역량 상승"으로 이어지는 흐름입니다.
  • 2025년 11월 Anthropic 사이버 보고서를 설명합니다. 중국 연계 자동화가 사이버 공격 캠페인의 최대 90%까지 도달했다는 핵심 내용을 다룹니다.
  • 화학/생물 실행 격차의 약화를 설명합니다. 비전 지원 모델이 습식 실험실 절차를 실시간으로 교정할 수 있다는 점이 핵심입니다.
  • 초보자 상대 역량 상승(novice-relative uplift)과 전문가 절대 역량(expert-absolute capability)의 비대칭을 정리하고, 이것이 안전 사례(safety case) 구성에 어떤 함의를 가지는지 설명합니다.

문제

17강은 측정 방법론이고, 30강은 2026년 현재의 측정 결과입니다. 2024년에서 2025년 말 사이에 그림은 실질적으로 바뀌었습니다. 네 영역 모두 2024년 프레임워크가 예상하지 못한 임계값을 각자의 방식으로 넘어섰거나, 넘지 않은 이유를 분명히 보여 주었습니다.

사전 테스트

2문제 · 이 강의를 시작하기 전에 얼마나 알고 있는지 확인해보세요

1.생물/화학 영역의 역량 상승(uplift) 서사는 2024년에서 2025년 사이 어떻게 변화했나요?

2.핵 영역의 역량 상승 평가가 나머지 세 CBRN 영역과 다른 이유는 무엇인가요?

0/2 답변 완료

개념

생물/화학 역량 상승 서사

세 단계로 정리할 수 있습니다. 흐름의 일관성을 위해 17강의 내용을 다시 짚습니다.

  1. 2024년 "약한 역량 상승(mild uplift)". 초기 Preparedness/RSP 평가는 인터넷 검색 대비 작은 초보자 이점만을 보고했습니다.
  2. 2025년 4월 "문턱에 있음(on the cusp)". OpenAI Preparedness Framework v2(PF v2)는 모델이 "초보자가 알려진 생물학적 위협을 만들도록 의미 있게 돕는 문턱에 있다"고 경고했습니다.
  3. 2025년 Anthropic 생물무기 획득 실험. 통제된 초보자 연구에서 획득 단계 과제에 대해 2.53배의 역량 상승이 관찰되었고, 이는 ASL-3을 배제하기에는 충분하지 않은 수준이었습니다.

변화는 양이 아니라 질에 있습니다. 모델 자체의 역량 돌파가 없었더라도 18개월 사이에 "약한"이라는 수식이 "현실적으로 가능하게 만들 수 있는" 수준으로 옮겨갔습니다.

화학/생물 실행 격차의 약화

역사적 방어 논리는 "정보는 필요하지만 충분하지 않으며, 프로토콜을 실제로 수행하는 기술이 초보자를 막아 준다"였습니다. 2025년의 비전 지원 프런티어 모델은 이 방어를 부분적으로 무너뜨립니다.

  • 실시간 프로토콜 교정. GPT-5.2, Gemini 3 Pro, Claude Opus 4.5, Grok 4.1과 같은 모델은 습식 실험실 영상을 관찰하고 절차 진행 중에 오류를 짚어낼 수 있습니다.
  • 2025년 12월 OpenAI 시연. GPT-5가 습식 실험을 반복 개선하며 프로토콜 최적화를 통해 79배의 효율 향상을 달성했습니다.

함의는 분명합니다. 실행 기술을 방어선으로 삼던 방식은 점차 약해지고 있습니다. 조달과 장비 격차는 여전히 남아 있지만, 직접 부딪쳐 봐야만 익혀지는 암묵지(tacit knowledge) 격차는 빠르게 좁아지는 중입니다.

사이버 영역의 역량 상승(2025년 11월)

Anthropic의 2025년 11월 보고서에 따르면, 중국 연계 국가 행위자들이 Claude의 에이전트형 코딩 도구를 사용해 사이버 공격 캠페인의 8090%를 자동화했습니다. 사람의 개입은 단 46단계에서만 필요했습니다.

함의는 다음과 같습니다.

  • 에이전트형 코딩(agentic coding)은 공격 자동화의 기본 단위가 되었습니다. 이전까지 AI의 사이버 지원은 코드 조각(code-snippet) 수준에 머물러 있었지만, 에이전트 워크플로는 정찰(reconnaissance), 취약점 악용(exploitation), 사후 침투(post-exploitation), 정보 유출(exfiltration) 단계를 하나로 통합합니다.
  • 4~6단계의 인간 개입이 현재의 병목이며, 미래의 역량 향상은 이 단계 수를 더욱 줄여 갈 것입니다.
  • 방어적 이중 용도의 사례도 있습니다. OpenAI의 신뢰 접근(trusted access) 파일럿은 검증된 보안 조직(확립된 사고 대응 회사, 정부)에 방어 목적의 역량 접근을 제공합니다. 이 파일럿이 확장되면 접근 비대칭은 방어자 쪽으로 유리하게 작용할 수 있습니다.

핵 영역

CBRN 네 영역 중 공개 문헌에서 가장 적게 분석된 영역입니다. 위협 모델 자체가 다른데, 어려움을 지배하는 것은 정보가 아니라 핵분열성 물질(fissile material)의 획득입니다. 정보 계층에서의 AI 역량 상승은 실제로 초보자에게 제한적인 효과만 제공합니다. 2024~2025년 주요 연구소 보고서 가운데 핵 영역에서 특화된 임계값 돌파를 식별한 사례는 없습니다.

초보자 상대 역량 상승과 전문가 절대 역량

네 영역 모두에서 공통적으로 관찰되는 패턴입니다.

  • 초보자 상대 역량 상승(novice-relative uplift). 효과가 큽니다. 곱셈적(multiplicative)으로 작용하며, Anthropic 2025년 생물 실험 기준으로 약 2.53배입니다.
  • 전문가 절대 역량(expert-absolute capability). 상한이 높습니다. 전문가는 무엇을 물어야 하고 결과를 어떻게 해석해야 하는지 알기 때문에, 같은 모델에서 초보자보다 훨씬 많은 것을 끌어냅니다.

이는 안전 사례에 다음과 같은 함의를 줍니다. 입력 필터, 거부 응답(refusal), 모델 불확실성만으로 초보자의 역량 상승만 다루는 방식으로는 전문가의 절대 역량을 통제하기에 충분하지 않습니다. 따라서 유도 강화(elicitation-hardening), 역량 비학습(capability unlearning, 17강), 제어 프로토콜(control protocols, 10강) 같은 추가 조치가 필요합니다.

영역 간 종합

영역2024년2025년변곡점
생물(Bio)약한 역량 상승2.53배 역량 상승, ASL-3 접근획득 단계 자동화
화학(Chem)약한 역량 상승비전 지원을 통한 실행 격차 약화실시간 습식 실험실 교정
사이버(Cyber)코드 조각 수준 지원캠페인의 80~90% 자동화에이전트형 코딩
핵(Nuclear)제한적제한적물질 접근 병목이 그대로 유지

세 영역은 임계값을 넘었습니다. 한 영역은 여전히 정보 외적인 장벽에 의해 묶여 있습니다.

Phase 18 안에서의 위치

30강은 phase 18의 캡스톤(capstone)에 해당합니다. 앞선 모든 강의가 측정하고, 제한하고, 거버넌스 대상으로 삼아 온 현재의 이중 용도 그림을 한자리에 모은 것입니다. 1718강은 측정 방법과 프레임워크를, 1216강은 평가 도구를, 24~25강은 규제와 정보 공개 계층을, 28강은 연구 생태계를 제공합니다. 30강은 그렇게 모인 증거가 도착하는 지점입니다.

사용해보기

이번 강의에는 실행할 코드가 없습니다. 다음 세 자료를 직접 읽어 봅니다. Anthropic의 2025년 11월 사이버 위협 보고서, OpenAI의 2025년 4월 Preparedness Framework v2 업데이트, Council on Strategic Risks의 2025 AI x Bio 연말 종합입니다.

산출물 만들기

이 강의에서는 outputs/skill-dual-use-triage.md를 산출물로 만듭니다. 2026년의 특정 역량 주장이나 사고 보고서가 주어졌을 때, 이 스킬은 네 영역에 걸쳐 그 주장을 분류(triage)하고, 해당 주장이 초보자 상대 역량 상승에 영향을 주는지, 전문가 절대 역량에 영향을 주는지, 아니면 둘 모두에 영향을 주는지 식별합니다.

연습문제

  1. (쉬움) Anthropic의 2025년 11월 사이버 보고서를 읽고, 보고서에서 언급된 4~6단계의 인간 개입 단계를 열거합니다. 그런 다음 다음 세대 모델에서 어느 단계가 가장 먼저 자동화될 가능성이 높은지 그 이유와 함께 논증합니다.

  2. (중간) 화학/생물 실행 격차는 비전 능력으로 인해 점차 약해지고 있습니다. ITAR/EAR 같은 수출 통제 경계를 넘지 않으면서 암묵지에 대한 역량 상승을 측정하는 평가를 설계합니다.

  3. (중간) 핵 영역에서의 역량 상승은 현재 물질 접근에 의해 제한된 것으로 보입니다. 미래의 AI 돌파가 이 병목을 옮길 수 있다는 입장에 찬성하는 논거와 반대하는 논거를 모두 제시합니다.

  4. (어려움) 초보자와 전문가의 역량 상승을 모두 제한하는 사이버 역량 프런티어 모델을 가정하고, 18강의 세 축(모니터링, 비가독화, 비역량화)에 기반한 안전 사례를 구성합니다.

  5. (어려움) 네 영역 중 하나를 선택하고 2024~2025년의 궤적에 기반해 2027년 전망을 한 문단으로 작성합니다. 이 전망을 반증할 수 있는 증거가 무엇인지도 함께 식별합니다.

핵심 용어

용어흔한 설명실제 의미
역량 상승(Uplift)"AI가 공격자를 돕는다"AI 지원으로 인해 공격자의 역량이 증가하는 정도
초보자 상대 역량 상승(Novice-relative uplift)"곱셈적이다"동일 작업을 현 상태(현 도구)로 수행할 때 대비 AI가 초보자에게 얼마나 도움이 되는지의 비율
전문가 절대 역량(Expert-absolute capability)"상한"전문가가 모델에서 끌어낼 수 있는 최대 역량 수준
실행 격차(Execution gap)"아는 것과 하는 것은 다르다"습식 실험실의 암묵지가 초보자의 위협 실행을 막는다는 역사적 방어 논리
에이전트형 코딩(Agentic coding)"자율적 공격"여러 단계의 사이버 작업을 자율적으로 수행하는 능력
획득 단계(Acquisition phase)"합성 이전 단계"생물학적 위협 시나리오에서 조달, 장비, 허가에 해당하는 사전 준비 단계
신뢰 접근(Trusted access)"방어자 전용 파일럿"검증된 방어자에게 모델 역량 접근을 부여하는 OpenAI의 2025년 프로그램

더 읽을거리

실습 코드

이 강의의 실습 코드 1개

main
Code

산출물

이 강의에서 생성된 프롬프트, 스킬, 코드 산출물 1개

dual-use-triage

Triage a capability claim or incident report across the four CBRN domains.

Skill

확인 문제

3문제 · 모두 맞추면 완료 표시가 가능합니다

1.Anthropic의 2025년 11월 보고서는 중국 연계 행위자가 에이전트형 코딩 도구를 사용해 사이버 공격 캠페인의 80-90%를 자동화했다고 발견했습니다. 남은 인간 병목은 무엇이었나요?

2.비전 지원 프런티어 모델이 생물/화학 실행 격차를 약화시키고 있습니다. 역사적 방어 논리를 무너뜨리는 이유는?

3.초보자 상대 역량 상승과 전문가 절대 역량은 안전 사례에 다르게 영향을 줍니다. 초보자 역량 상승만 겨냥한 방어가 전문가 위협을 막을 수 없는 이유는?

0/3 답변 완료

추가 문제 풀기

AI가 강의 내용을 바탕으로 새로운 문제를 생성합니다