# Evidence Register

## Executive Finding

병원별 폐암 신규환자 수를 직접 제공하는 공개 공식 결과표는 확인되지 않았습니다. 현재 가장 설득력 있는 경로는 `HIRA 병원별 C33/C34 신규 진료환자 산출`과 `NHIS 전국 신규 산정특례 등록 추세`를 결합하는 방식입니다.

## Primary Sources

| ID | Source | What It Supports | Link |
|---|---|---|---|
| NHIS-PUBLIC-01 | 국민건강보험공단_질환별 신규암 등록 현황_20251130 | 전국 월별 폐암 신규 산정특례 등록자 수. 기간 2023-01~2025-11, 폐암 C33/C34. | [data.go.kr](https://www.data.go.kr/data/15144841/fileData.do) |
| HIRA-CUSTOM-01 | HIRA 보건의료빅데이터 맞춤형 연구자료 | 학술/공공/산업계 대상 맞춤형 연구자료, 청구명세서 기반, 비식별 처리, 심의 후 분석시스템 제공. | [HIRA data info](https://opendata.hira.or.kr/op/opb/selectHelhMedDataInfoView.do) |
| HIRA-REQUEST-01 | HIRA 빅데이터분석 이용신청안내 | 상병, 약품, 행위를 조합하여 연구대상자와 변수 선택 가능. 요양기관 종별/소재지 조건 존재. | [HIRA application guide](https://opendata.hira.or.kr/or/orb/selectOrgnDataAplGdPop.do) |
| HIRA-HOSP-01 | 건강보험심사평가원_병원정보서비스 | 병원 기본정보 조회, 요양기관 현황 신고 기준, 공개 API의 요양기호는 암호화 제공. | [data.go.kr](https://www.data.go.kr/data/15001698/openapi.do) |
| NCR-2023-01 | 국가암정보센터 2023년 암종별 발생 현황 | 2023년 폐암 발생자 수 32,953명, 전체 암 2위. | [cancer.go.kr](https://edu.cancer.go.kr/lay1/S1T639C641/contents.do) |
| NCR-2023-02 | 2023년 국가암등록통계 자료실 | 보도자료, 참고자료, 발표자료 원문 패킷. | [cancer.go.kr](https://www.cancer.go.kr/lay1/bbs/S1T674C816/B/61/view.do?article_seq=85579) |
| HIRA-CLAIM-01 | HIRA 진료비심사 업무안내 | 요양기관 청구명세서, 상병코드, 청구내역 심사 흐름의 제도적 배경. | [hira.or.kr](https://www.hira.or.kr/dummy.do?pgmid=HIRAA990001000310) |

## Verified Public Data Snapshot

Source file: `data/raw/nhis_new_cancer_by_disease_20251130.csv`

| Year | Months | Lung Cancer New Special-Case Registrations | Monthly Avg | Annualized |
|---:|---:|---:|---:|---:|
| 2023 | 12 | 27,555 | 2,296 | 27,555 |
| 2024 | 12 | 26,479 | 2,207 | 26,479 |
| 2025 | 11 | 24,960 | 2,269 | 27,229 |

Latest month:

| Period | Lung Cancer | YoY |
|---|---:|---:|
| 2025-11 | 2,152 | -4.6% |

2025 YTD through November:

| Metric | Value |
|---|---:|
| 2025 Jan-Nov | 24,960 |
| 2024 Jan-Nov comparable | 23,987 |
| YoY | +4.1% |

## Interpretation Rules

- `신규 산정특례 등록자` is not the same as `true first-ever cancer incidence`.
- Public NHIS data does not identify hospitals.
- HIRA claims analysis can estimate new patients first treated/claimed at each institution, but this is a claims-based operational definition.
- National Cancer Registry is the incidence benchmark, not a hospital volume dataset.
- Hospital-level release should use aggregated outputs and small-cell suppression rules after data provider review.

## Hospital-Level Data Path

1. Submit HIRA customized research request for C33/C34 claims.
2. Use 2019-01 onward data to support a five-year wash-out.
3. Define index date as first C33/C34 claim in the analysis period.
4. Aggregate by institution code or approved institution group, year, and month.
5. Split outputs into new lung-cancer visit patients and treatment-initiation patients.
