# 2025/2026 Lung Cancer Data Strategy

작성일: 2026-05-15
프로젝트: HPM01

## 1. Executive Summary

이 프로젝트에서 실제로 필요한 값은 2025년, 2026년 현재, 그리고 이후 추가되는 폐암 환자 관련 데이터다. 다만 공개 웹에서 바로 확인 가능한 값과 심의 승인 후에만 받을 수 있는 값을 분리해야 한다.

현재 공식 공개 채널에서 바로 자동화 가능한 핵심값은 전국 월별 신규암 산정특례 등록 흐름, 국가암등록 연간 발생, 사망률, 병원/검진기관/약제/치료행위 context다. 병원별 폐암 신환 수는 HIRA 또는 NHIS 맞춤형 자료 승인 후 공식 집계 layer로 넣어야 한다.

## 2. Data Layers

### Layer A. Confirmed Count

확정 수치로 표시 가능한 계층이다.

- NHIS 신규암 산정특례 공개자료: 전국 월별 C33/C34 추세.
- 국가암등록통계/KOSIS: 연간 폐암 발생 anchor.
- 통계청 사망원인통계/KOSIS: 폐암 사망자 수와 사망률.
- HIRA/NHIS 맞춤형 승인자료: 병원별 또는 기관군별 C33/C34 신규 진료/등록 집계.

### Layer B. Near-Current Proxy

2025/2026 현재성을 보강하지만 신환 수로 직접 표시하지 않는다.

- HIRA 암 상병 진료비 통계.
- HIRA 4단 상병 × 요양기관 종별 건강보험 통계.
- HIRA 병원정보/의료기관 상세정보 API.
- HIRA 폐암 적정성 평가.

### Layer C. Care Environment

환자에게 적절한 진단/치료 환경을 찾기 위한 보조 layer다.

- NHIS 검진기관 대체 API: 저선량 CT 등 검진 capacity proxy.
- NHIS 암종 × 항암성분 치료 현황.
- NHIS 암환자 주요 치료 행위 통계.
- MFDS 의약품 품목허가 API.
- HIRA 약효분류/성분코드 API.

## 3. 2026 Handling Rule

2026년 값은 다음 기준으로 처리한다.

- 공식 수치가 아직 없으면 `pending`.
- 공식 파일/API가 최신 월을 제공하지 않으면 `stale`.
- 공개 지표가 proxy이면 `proxy` 또는 source description에서 명확히 표시.
- 병원별 신환 수는 맞춤형 승인 전까지 빈 값으로 유지.

## 4. Priority Pipeline

1. NHIS 신규암 공개자료 업데이트 확인.
2. KOSIS 국가암등록/사망원인 연간 값 반영.
3. NHIS 검진기관 대체 API fetcher 구현.
4. HIRA 병원/상세정보 cache 안정화.
5. HIRA/NHIS 치료행위·항암성분·약제 master 연결.
6. HIRA/NHIS 맞춤형 자료 승인 후 병원별 집계 import.

## 5. Custom Data Import Contract

승인 자료를 받은 뒤에는 다음 CSV 또는 JSON 구조로 import한다.

```text
period
year
month
institution_key
institution_name_or_group
provider_type
region
new_lung_cancer_visit_patients
c33_count
c34_count
outpatient_count
inpatient_count
anti_cancer_treatment_start_count
radiation_treatment_count
surgery_count
source_name
source_status
method_note
```

`institution_name_or_group`은 심의 결과에 따라 병원명, 요양기관기호, 또는 비식별 기관군이 될 수 있다.

## 6. Patient-Centered Interpretation

이 dashboard는 특정 환자에게 치료를 추천하는 의료기기가 아니다. 대신 다음 판단을 돕는 evidence map이다.

- 폐암 환자 등록 흐름이 어느 시점에 증가/감소했는가.
- 어느 지역의 발생/사망/검진 capacity gap이 커 보이는가.
- 어떤 병원군이 폐암 진료 인프라와 quality indicator를 갖추고 있는가.
- 어떤 항암성분과 치료행위 데이터를 추가로 추적해야 맞춤형 항암제 접근성을 설명할 수 있는가.

## 7. Non-Negotiables

- 병원별 신환 수는 공개 API metadata로 만들지 않는다.
- 2026년 미공개 수치를 임의 예측값으로 채우지 않는다.
- proxy와 count를 같은 색/라벨로 표시하지 않는다.
- 출처, 최신 기준월, 해석 한계를 모든 핵심 panel에 붙인다.
