Diffie-Hellman과 인덱스 미적분(Index Calculus) 공격

Index Calculus는 유한체 $\mathbb{F}_p^*$ 위에서 정의된 이산로그 문제(DLP) 를 풀기 위한 가장 강력한 sub-exponential 알고리즘이다. 고전 Diffie-Hellman(DH)의 안전성을 직접적으로 무너뜨리는 핵심 공격으로, 오늘날 권장되는 DH 모듈러스 크기(≥ 2048-bit)의 근거가 된다.

1. 배경 — Diffie-Hellman과 DLP

고전 Diffie-Hellman 키 교환은 큰 소수 $p$ 와 생성원 $g \in \mathbb{F}_p^*$ 에 대해 다음 가정을 기반으로 한다.

Alice: 비밀 $a$ , 공개 $A = g^a \bmod p$
Bob: 비밀 $b$ , 공개 $B = g^b \bmod p$
공유키: $K = g^{ab} \bmod p$

공격자는 $g, p, A, B$ 를 보고 $K$ 를 구하려 한다. 이를 위해 보통 이산로그 $a = \log_g A$ 를 구해야 한다 — 이것이 DLP (Discrete Logarithm Problem).

Eve가 도청해서 보는 것

✓ g, p, A, B (본다)✗ a, b, K (못 봄)

K를 얻으려면 결국 DLP를 풀어야 함

Fig 1. Diffie-Hellman 키 교환 — Alice와 Bob 두 액터 사이의 메시지 시퀀스. Eve는 와이어를 도청해도 g, p, A, B만 본다.

DH의 안전성 ≤ DLP의 어려움 — DLP를 풀 수 있으면 DH는 깨진다. 단 역방향(DH를 깨면 DLP도 풀린다)은 증명돼 있지 않고, DH의 표준 안전성 가정은 엄밀히는 CDH/DDH다. 즉 DLP는 DH 안전성의 상한이지 동치는 아니다.

2. 왜 Brute-force / BSGS만으로는 부족한가

알고리즘	시간 복잡도	메모리	비고
Brute-force	$O(p)$	$O(1)$	비현실적
Baby-step Giant-step	$O(\sqrt{p})$	$O(\sqrt{p})$	일반 군에 통함
Pollard's rho	$O(\sqrt{p})$	$O(1)$	일반 군에 통함
Pohlig–Hellman	$O(\sqrt{q})$ ( $q$ : 최대 소인수)	—	군 위수의 인수분해 의존
Index Calculus	$L_p[1/2, c]$ 또는 $L_p[1/3, c]$ (NFS-DLP)	큰 메모리	$\mathbb{F}_p^$ 등 특정 군에서만 작동*

여기서 $L_p[\alpha, c] = \exp\!\left(c (\ln p)^{\alpha} (\ln \ln p)^{1-\alpha}\right)$ 는 sub-exponential 함수.

핵심 차이: Index Calculus는 $\mathbb{F}_p^*$ 의 추가 구조(정수의 인수분해)를 이용한다. 따라서 동일한 비트수의 타원곡선(ECDLP)에는 적용되지 않으며, 이것이 ECDH가 동일 보안 수준에서 훨씬 작은 키를 쓰는 이유다.

Brute-force

→

2²⁰⁴⁸

Pollard's rho / BSGS

→

2¹⁰²⁴

Index Calculus $L_p[1/2]$

2¹⁸⁰

NFS-DLP $L_p[1/3]$

2¹²⁸

↑ 안전 임계 (128-bit)

Brute-force / Pollard's rho는 스케일을 한참 벗어남. Index Calculus 계열만이 실용적 위협이고, 그중 NFS-DLP가 2048-bit를 ‘NIST 112-128bit 보안 등급'에 묶는다.

Fig 2. 2048-bit FFDH에 대한 각 알고리즘의 비용 — log₂(연산 수) 기준. 128-bit 위가 "안전"한 영역.

3. Index Calculus 알고리즘 — 3단계 구조

목표: $g, h \in \mathbb{F}_p^*$ 가 주어졌을 때 $x$ 를 구한다, 단 $h \equiv g^x \pmod{p}$ .

Factor base

작은 소수 집합 선택

B = {2, 3, 5, 7, …, p_k}

Relations

B-smooth한 g^e 를 모아 관계식 생성

g^e ≡ ∏ p_i^{a_i} (mod p)

Linear algebra

선형 연립방정식 풀어 log_g p_i 추출

{ log_g p_i } mod (p−1)

Individual log

h·g^s 가 smooth해질 때까지 시도

log_g h = Σ b_i · log_g p_i − s

한 번 Step 1–3을 수행하면, 같은 p에서의 새 목표 h는 Step 4만으로 즉시 풀린다 — Logjam의 핵심.

Fig 3. Index Calculus 4단계 — 작은 소수 인수분해를 활용해 DLP를 선형대수 문제로 환원한다.

Step 1. Factor base 선택

작은 소수들의 집합 $B = \{p_1, p_2, \dots, p_k\}$ 을 고른다 (e.g. $p_i \le B$ , smoothness bound).

Step 2. Relation collection (관계식 수집)

임의의 지수 $e$ 에 대해 $g^{e} \bmod p$ 를 계산하고, 그 결과가 B-smooth(즉, $B$ 이하의 소수들만으로 인수분해되는가)인지 확인한다.

smooth하면 다음과 같은 관계식이 얻어진다:

g^{e} \equiv \prod_{i=1}^{k} p_i^{a_i} \pmod{p}

양변에 $\log_g$ 를 취하면:

e \equiv \sum_{i=1}^{k} a_i \cdot \log_g p_i \pmod{p-1}

이런 식 $k+$ 개 이상을 모으면, 미지수 $\log_g p_i$ 에 대한 선형 연립방정식이 된다.

Step 3. Linear algebra — factor base의 로그 계산

위 연립방정식을 $\bmod (p-1)$ 에서 풀어 $\log_g p_1, \dots, \log_g p_k$ 를 얻는다. 보통 Lanczos / Wiedemann 같은 sparse linear algebra 알고리즘 사용.

Step 4. Individual logarithm — 목표 $h$ 의 로그 구하기

임의의 $s$ 에 대해 $h \cdot g^{s} \bmod p$ 가 B-smooth가 될 때까지 시도. 성공 시:

h \cdot g^{s} \equiv \prod p_i^{b_i} \pmod{p} \;\Longrightarrow\; \log_g h \equiv \sum b_i \log_g p_i - s \pmod{p-1}

이미 Step 3에서 $\log_g p_i$ 를 알고 있으므로 $\log_g h$ 가 곧장 계산된다.

4. 토이 예제 — $p = 1019$

$g = 2$ , $h = 5$ 일 때 $x$ 를 구한다고 하자 ( $2^x \equiv 5 \pmod{1019}$ ).

Factor base: $B = \{2, 3, 5, 7\}$ .

smooth한 $g^e \bmod p$ 를 모은다:

$2^{10} = 1024 \equiv 5 \pmod{1019}$ → $10 \equiv \log_2 5$

운이 좋아 한 번에 풀렸지만, 일반적으로는 수십~수백 개 관계식을 모아 선형대수로 일괄 해결한다.

5. 복잡도 분석 — 왜 sub-exponential인가

핵심은 smoothness 확률이다. Canfield–Erdős–Pomerance 정리에 의해, $x$ 이하의 임의 수가 $y$ -smooth일 확률은 대략:

\rho(u) \approx u^{-u}, \quad u = \frac{\log x}{\log y}

Factor base 크기 $B$ 와 관계식 수집 비용의 트레이드오프를 최적화하면:

단순 Index Calculus: $L_p[1/2, \sqrt{2}]$
Number Field Sieve for DLP (NFS-DLP): $L_p[1/3, (64/9)^{1/3}]$

NFS-DLP는 현재 prime-field DLP의 최첨단으로, RSA 정수분해와 같은 복잡도 클래스다.

6. 실제 기록 — 몇 비트까지 깨졌나

연도	비트 수	기법	비고
2014	596-bit	NFS-DLP	Bouvier et al.
2016	768-bit	NFS-DLP	Kleinjung et al.
2017	1024-bit (special prime)	SNFS-DLP	Fried, Gaudry, Heninger, Thomé (Logjam 후속)
2019+	795-bit (safe prime)	NFS-DLP	Boudot et al.

Prime-field DLP (DH 안전성과 직결)

2014

NFS-DLP · Bouvier et al.

596-bit

2016

NFS-DLP · Kleinjung et al.

768-bit

2017

SNFS-DLP · Fried, Gaudry, Heninger, Thomé (special prime)

1,024-bit

2019

NFS-DLP · Boudot et al. (safe prime)

★ Standing record (2026)

795-bit

↑ 현재 권장 임계 2048-bit

2020~2026: 새 공개 기록 없음. 2048-bit가 안전 기준선으로 자리잡은 직접 근거.

참고: 특수 체 (DH와 무관)

2019

FFS · Granger, Kleinjung, Lenstra, Wesolowski, Zumbrägel — GF(2^30750)

30,750-bit

~2022

FFS · Medium-characteristic 22-bit

1,051-bit

특수 체(특히 작은 표수)는 quasi-polynomial 공격이 가능해 별개로 다뤄짐. DH는 prime-field만 사용하므로 위 기록과 직접 연관 없음.

Fig 4. Prime-field DH (실제 DH 보안에 직결되는 군)에 대한 NFS-DLP 기록 — 2019년 795-bit safe prime 이후 새 공개 기록 없음 (2026년 기준 standing).

→ 표의 1024-bit 기록은 공격자가 백도어를 심을 수 있는 special(hidden SNFS) prime에 대한 것으로, 임의의 일반 1024-bit safe prime을 깬 게 아니다. 공개된 일반 prime-field 최고 기록은 여전히 2020년 Boudot et al.의 795-bit(safe prime)다. 그럼에도 널리 재사용되는 1024-bit prime이라면 사전계산에 국가급 자원을 투자해 깰 수 있는 수준(Logjam 추정)이며, 위협의 핵심은 재사용되는 prime에 사전계산이 amortize된다는 데 있다. NIST/IETF가 2048-bit 이상을 요구하는 직접적 근거.

7. Logjam 공격 (2015) — Index Calculus의 실전 응용

Logjam은 Index Calculus의 가장 유명한 실전 사례다.

핵심 아이디어

TLS의 DHE_EXPORT가 512-bit 모듈러스를 강제 — downgrade 가능.
인터넷 전반에서 공유되는 prime $p$ 가 소수 — Apache, mod_ssl 기본값 등.
Precomputation: NFS-DLP의 Step 1~3 (factor base + linear algebra)는 $p$ 에만 의존. 한 번 해두면 같은 $p$ 를 쓰는 모든 세션을 Step 4 (individual log)만으로 거의 실시간에 깰 수 있다.

결과

512-bit DH: 학술 자원으로 약 1주 → 세션 당 90초 내 individual log.
1024-bit DH (널리 공유된 prime): NSA급 자원이면 충분히 가능 — Snowden 문서 속 "large-scale VPN/SSH decryption" 정황과 일치.

공유 prime이 없을 때

세션마다 전체 NFS-DLP

사전계산

—

세션당

~ $1M

공격 가능 세션

공유 prime이 있을 때 (Logjam)

사전계산 1회 + Step 4만 반복

사전계산 (1회)

~ $1M

세션당

~ 90s

공격 가능 세션

공유 prime의 모든 세션

공유 prime은 단일 시스템의 위험이 아니라 그 prime을 쓰는 모든 세션의 위험으로 번진다.

Fig 5. Logjam의 비용 구조 — 같은 prime을 공유하는 시스템이 많을수록 공격자 ROI가 극단적으로 좋아진다.

교훈: 약한(≤1024-bit)·검증되지 않은·널리 재사용되는 prime을 피할 것, 2048-bit 이상(가능하면 검증된 RFC 7919 FFDHE 그룹) 사용, ECDHE 우선. — 잘 검증된 큰 prime을 공유하는 것 자체는 문제가 아니다(RFC 7919가 바로 표준 공유 그룹이다); 위험한 건 작은·약한 prime에 사전계산이 amortize되는 경우다.

8. 방어 가이드라인

✅ 유한체 DH는 2048-bit를 최소선으로 ( $p \ge 2048$ , ≈ 112-bit 보안 — RFC 9325의 DHE 최소 요구치). 128-bit 보안이 목표면 3072-bit 이상 (NIST SP 800-57 기준 FFC 3072 ≈ ECC 256 ≈ 128-bit).
✅ Safe prime ( $p = 2q+1$ , $q$ 소수) 사용. Pohlig–Hellman 회피.
✅ RFC 7919 (FFDHE)의 표준화된 그룹 사용 — 정밀 검증된 prime.
✅ ECDHE 우선 채택 — Index Calculus가 적용되지 않음. 256-bit 곡선이 3072-bit FFDH와 동급 보안. RFC 9325·NIST SP 800-186도 X25519·P-256(및 Edwards 계열 곡선)을 권장.
✅ TLS에서 export 암호군 비활성화 (Logjam 방어).
⚠️ 약한·검증되지 않은 공유 prime 주의 — 작은/재사용 prime이 깨지면 같은 prime을 쓰는 모든 시스템이 영향 (검증된 RFC 7919 2048-bit+ 표준 그룹의 공유는 무방).
🔮 PQC 전환 — Shor 알고리즘이 모든 DLP/ECDLP를 다항 시간에 푼다. 2024년 NIST가 FIPS 203 (ML-KEM) · 204 (ML-DSA) · 205 (SLH-DSA)를 최종 표준화했고, 2025년 HQC를 ML-KEM 백업 KEM으로 선정. 실무에선 기존 X25519/ECDHE와 ML-KEM을 결합한 hybrid key exchange가 이미 TLS에 배포 중 (예: X25519MLKEM768) — 키 교환은 ML-KEM(FIPS 203) 중심으로 이동하는 흐름.

9. ECDH는 왜 안전한가

타원곡선군 $E(\mathbb{F}_p)$ 에는 "인수분해" 개념이 없다 — 작은 "소수 점" factor base를 만들 수 없다.

따라서 Index Calculus가 작동하지 않고, 가장 빠른 알고리즘은 일반군용 Pollard's rho ( $O(\sqrt{n})$ ). 이것이 ECDH의 키 길이가 짧아도 되는 수학적 이유.

FFDH

유한체 prime $p$

3,072bit

ECDH

Curve25519, P-256 등

256bit

보안 수준: 128-bit (Pollard's rho on ECDH = 2¹²⁸)

Index Calculus가 FFDH에는 적용되고 ECDLP에는 적용되지 않기 때문. 같은 안전 수준에서 더 작은 키 = 더 빠른 핸드셰이크, 더 적은 대역, 더 작은 인증서.

Fig 6. 동일한 ‘128-bit 보안 등급'에 도달하기 위한 키 길이 — FFDH는 ECDH 키의 12배가 필요.

ECDH (Pollard's rho)

FFDH (NFS-DLP)

ECDH 256-bit ≈ FFDH 3072-bit (그래프상 같은 가로선 위에 위치). FFDH 곡선이 완만한 이유는 sub-exponential 공격 때문.

Fig 8. 키 크기 vs 보안 강도 — 같은 X(키 비트)에서 ECDH의 Y(보안 비트)는 FFDH보다 훨씬 가파르게 오른다. 가로 점선은 ‘128-bit 보안' 임계.

단, 다음 곡선들은 취약하므로 피해야 한다:

Supersingular curves → MOV/Frey–Rück 공격으로 ECDLP를 작은 차수 확장체의 DLP로 환원 → Index Calculus 적용 가능.
Anomalous curves ( $\#E(\mathbb{F}_p) = p$ ) → Smart 공격으로 다항 시간.

10. 고정 상수와 난수 — 흔한 오해와 실전 사고

"ECDH는 곡선·베이스 포인트 $G$ 같은 상수가 고정되어 있는데, 반복 관찰하면 예측 가능하지 않나?" — 자연스러운 직관이지만, 고정된 건 공개 운동장이고 매 세션의 비밀은 따로 있다. 실제 사고는 곡선 상수가 아니라 난수가 고정·편향될 때 터진다.

10.1 ECDH에서 "고정"인 것 vs "매번 바뀌는" 것

구분	항목	공개/비밀	매 세션 변화?
도메인 파라미터	곡선 $E$ , 소수 $p$ , 베이스 포인트 $G$ , 위수 $n$	공개	❌ 고정 (예: secp256k1, Curve25519, NIST P-256)
개인키	스칼라 $d \in [1, n-1]$	비밀	✅ 매번 새 난수 (ECDHE)
공개키	$Q = dG$	공개	✅ 매번 달라짐
공유 비밀	$K = d_A d_B G$	비밀	✅ 매번 달라짐

곡선· $G$ 는 모두에게 공개된 운동장이고, 매 세션의 비밀은 개인키 스칼라 $d$ 다. 공격자가 같은 곡선을 쓰는 수십만 세션을 관찰해도 매번 보는 건 독립된 난수로 뽑힌 $d_{A_i}, d_{B_i}$ 들이고, $A_i = d_{A_i} G$ 로부터 $d_{A_i}$ 를 복구하려면 결국 ECDLP를 풀어야 한다 ( $O(\sqrt{n})$ Pollard's rho, 256-bit면 $2^{128}$ ).

고정 (Fixed)

매 세션 새로 (Fresh)

공개 (Public)

✓도메인 파라미터

곡선 E, base point G, 위수 n

공개를 전제로 설계됨

✓공개키

Q = dG (매 세션 새 d)

공개 브로드캐스트 안전

비밀 (Secret)

✗재사용된 비밀

PS3 ECDSA nonce, Static ECDH 키

한 번의 노출로 즉사

✓ECDHE 임시키

검증된 CSPRNG에서 매번 새 d

권장 표준

ECDH의 ‘고정' 부분은 모두에게 공개된 운동장이고, 위험은 항상 비밀이 고정되는 순간 발생한다.

Fig 7. ECC에서 ‘고정 vs 매번 새로'와 ‘공개 vs 비밀'의 안전성 매트릭스 — 사고는 거의 모두 우측 하단의 반대편(비밀 + 고정)에서 터진다.

여러 세션의 관찰이 ECDLP를 더 쉽게 만들지 않는다. 각 인스턴스가 수학적으로 독립이라 누적 정보의 이득이 없다. 이것이 Index Calculus와의 결정적 차이 — IC는 같은 prime $p$ 에서의 factor base 사전계산이 모든 세션에 재사용되지만, ECC에는 그런 구조 자체가 없다.

10.2 진짜로 위험한 "고정" — 실전 사고 사례

질문의 직관은 사실 실전 공격이 실제로 일어난 지점을 잘 짚었다. 다만 깨지는 건 곡선 상수가 아니라 난수(개인키 또는 임시값) 쪽이다.

Case 1. PS3 ECDSA 해킹 (2010, fail0verflow)

Sony가 ECDSA 서명에서 매번 같은 nonce $k$ 를 사용. 두 서명만 있으면 개인키가 대수적으로 복구됨:

s_1 = k^{-1}(z_1 + r d), \quad s_2 = k^{-1}(z_2 + r d) \;\Longrightarrow\; k = \frac{z_1 - z_2}{s_1 - s_2}, \quad d = \frac{s_1 k - z_1}{r}

이는 서명의 실패 모드라는 점에 주의 — nonce 재사용은 서명 개인키를 대수적으로 즉시 노출한다. 정적 ECDH 키 재사용은 이와 별개의 문제로, 그 자체로 키가 바로 털리는 게 아니라 forward secrecy 상실 및 invalid-curve / small-subgroup 검증 실패와 결합될 때 위험해진다 (아래 Case 3).

Case 2. Android Bitcoin 지갑 사태 (2013)

SecureRandom 버그로 ECDSA nonce가 예측 가능한 값이 되어 다수의 비트코인 지갑 개인키가 털림. 곡선(secp256k1)은 멀쩡했고, 문제는 OS의 RNG였다.

Case 3. Static ECDH의 Invalid Curve Attack

양쪽이 개인키를 고정해서 재사용하면 공격자가 곡선 위에 없는 "이상한 점"을 보내 작은 부분군으로 끌어내려 비밀 비트를 CRT로 한 비트씩 뽑아낸다. 이래서 실무에서는 ECDHE (Ephemeral) 가 강제된다. 한편 X25519가 안전한 건 표준이 점 검증을 강제해서가 아니라 — RFC 7748은 all-zero 공유 비밀 검사조차 MAY로 둔다 — 곡선 설계 자체(트위스트 보안 + Montgomery ladder)가 invalid-curve 위험을 줄이도록 만들어졌기 때문이다.

Case 4. Dual_EC_DRBG 백도어 의혹 (2007/2013)

난수 생성기 자체의 상수 점 $P, Q$ 가 백도어를 품고 있어서 ( $Q = eP$ 의 $e$ 를 아는 자만이) 출력으로부터 내부 상태 복구 가능 — NSA 개입설. "특정 상수가 고정"이라는 점이 실제로 문제였던 드문 사례. 그래서 표준 곡선들도 "nothing-up-my-sleeve" 검증이 중요하다 (Curve25519, Brainpool 등이 강조하는 이유).

10.3 결론 — 어디를 보호해야 하는가

✅ 공개 도메인 파라미터(곡선· $G$ )가 고정인 건 문제 없음 — 모두 공개라는 전제 아래 설계됐고 ECDLP가 보호한다.
❌ 개인키 / 임시 난수가 고정되거나 편향되면 즉사 — 거의 모든 실전 ECC 사고가 여기서 발생.
실무 권고:
- ✅ ECDHE (매 세션 새 임시키)
- ✅ 검증된 CSPRNG (/dev/urandom, getrandom(2), OS API)
- ✅ 결정적 nonce (RFC 6979) 또는 EdDSA처럼 nonce를 Hash(key ‖ message)로 유도 — RNG 실패에도 강건
- ✅ 검증된 표준 곡선 (Curve25519, Ed25519, NIST P-256, secp256k1) — 널리 분석됐고 알려진 실용 백도어는 없음. 단 파라미터 생성 투명성은 곡선마다 다르다 (Curve25519는 rigid/nothing-up-my-sleeve 설계, NIST P-256은 시드 출처가 불투명한 편)
- ⚠️ 자체 곡선 만들기 금지 — Dual_EC_DRBG 교훈

11. 정리 — 한 줄 요약

Index Calculus는 $\mathbb{F}_p^*$ 의 정수론적 구조(smoothness)를 이용해 DLP를 sub-exponential 시간에 푸는 알고리즘이며, 이로 인해 고전 DH는 ECDH보다 훨씬 큰 키를 요구하고, 실전 공격(Logjam)으로 이어졌다. ECDH의 "고정 상수"는 공개 운동장일 뿐, 실전 사고는 거의 항상 난수 쪽에서 터진다.

참고 자료

Adleman, L. (1979). A subexponential algorithm for the discrete logarithm problem with applications to cryptography.
Pomerance, C. (1987). Fast, rigorous factorization and discrete logarithm algorithms.
Adrian, D. et al. (2015). Imperfect Forward Secrecy: How Diffie-Hellman Fails in Practice (Logjam paper).
Boudot, F. et al. (2020). Comparing the difficulty of factorization and discrete logarithm: a 240-digit experiment (795-bit safe-prime DLP).
Fried, J., Gaudry, P., Heninger, N., Thomé, E. (2017). A kilobit hidden SNFS discrete logarithm computation.
RFC 7919 — Negotiated Finite Field Diffie-Hellman Ephemeral Parameters for TLS.
RFC 9325 — Recommendations for Secure Use of TLS and DTLS.
NIST SP 800-57 Part 1 Rev.5 — Recommendation for Key Management. / SP 800-186 — Discrete-Logarithm-Based Cryptography (elliptic-curve domain parameters).
NIST FIPS 203 — Module-Lattice-Based Key-Encapsulation Mechanism (ML-KEM), 2024. (FIPS 204 ML-DSA, 205 SLH-DSA; HQC 백업 KEM 선정 2025.)

Diffie-Hellman과 인덱스 미적분(Index Calculus) 공격

Prime-field DLP (DH 안전성과 직결)

참고: 특수 체 (DH와 무관)

댓글