1. DIKW 피라미드
 ☐ DIKW란 'Data → Information → Knowledge → Wisdom' 의 정보의 가치 단계를 나타내는 피라미드 형태의 표
     - Data가 모여 Information이 되고,
        Information이 모여 더 가치가 있는 Knowledge가 되고,
        Knowlegde가 모여 Wisdom 수준의 최상위 가치를 가진 정보를 산출한다는 정보 이론
 ☐ DIKW는 Data들의 양적, 질적 결합의 당위성을 설명해주는 이론
     - 소위 말하는 "구슬은 꿰어야 보배다" 라는 속담처럼, 데이터들의 결합을 통해 Wisdom 을 산출하는 것이 최종 목표
     - '마이데이터', '공공데이터' 등의 사업의 이론적 근거
 ☐ AI 기술의 발전으로 DIKW 가치 사슬 가속화
     - AI 기술 발전 이전에는 Data 단계에만 머물러 있었으나,
        AI 기술 발전 이후, Data로 Information, Knowledge, Wisdom 창출이 가속화 되었고, 이에 따라 다양한 비즈니스가 파생/성장
 ☐ 이종 산업의 데이터들을 결합하는 목적은 1차적으로 AI 모델에 학습 데이터를 제공하는 것이기에, 
      데이터 결합에만 매몰되지 않고, 관련 AI 모델까지 고려하는 관점 필요
     - Data 단계에서 Wisdom 단계까지 가는 걸 가능하게 해주는 AI 모델을 처음 설계 단계부터 고려하는 관점 필요
 
2. 데이터 결합의 종류
 ☐ 정보주체의 동의를 받아야 하는지에 따라 '가명데이터 결합' 과 '개인정보 결합' 으로 분류
     - '가명데이터 결합'은 정보주체의 동의 없이 통계작성/과학적 연구/공익적 기록보존의 목적으로 '가명처리' 후 결합 가능
     - '개인정보 결합'은 정보주체의 동의를 필수적으로 요하며, 제한적 목적으로 제한적 데이터만을 다룰 수 있는 등 관련 법의 엄격한 제한
        하에 (개인정보 보호법, 신용정보의 이용 및 보호에 관한 법률) 결합 가능
 ☐ 데이터결합은 금융 데이터의 경우 데이터전문기관을 통해, 비금융 데이터의 경우, 결합전문기관을 통해 결합가능
     - 데이터전문기관은 '신용정보의 이용 및 보호에 관한 법률' 에
        결합전문기관은 '개인정보 보호법' 에 근거를 둠
     - 금융데이터는 '신용정보의 이용 및 보호에 관한 법률' 에
        비금융데이터는 '개인정보 보호법' 에 따라 규제
 ☐ 데이터결합시 고객으로부터 추가적으로 개인정보 수집/이용 동의를 받아야 하므로, 기존 마케팅 동의율이 하락할 수 있음
     - 사전적으로 ROE 와 "마케팅 동의율 하락분" 을 비교해서 해당 프로젝트를 진행할지 여부의 의사결정을 해야 함
 
3. 데이터 가명처리, 익명처리, Information Loss
 ☐ 데이터 가명처리는 '추가정보'를 사용하지 아니하고는 신용정보주체를 알아볼 수 없도록 하면서, 동시에 그 처리 결과가 어떤 신용정보주체와 다른 신용정보주체가 구별되게 처리하는 것
     - '추가정보' 란 가명정보를 원상태로 복원하는 데 사용 가능한 값
        예를 들어, 가명정보 생성시 사용한 암호 알고리즘 등
     - 즉, '추가정보'를 이용해서 '가명데이터'를 '개인정보'로 복원시킬 위험성 존재. 따라서 '추가정보'를 분리 보관하도록 법제화
        (신용정보의 이용 및 보호에 관한 법률 제40조의2 제1항)
 ☐ 데이터 익명처리는 더 이상 신용정보주체를 알아볼 수 없도록 개인신용정보를 처리하는 것
     - '익명처리' 란 데이터 값 삭제, 가명처리, 총계처리, 범주화 등의 방법으로 개인신용정보의 전부/일부를 삭제 또는 대체하여 더 이상 신용정보주체를 알아볼 수 없도록 처리
     - '익명정보' 는 개인정보가 아니기 때문에 제한없이 활용 가능 (이에 반해 '개인정보'는 정보주체로부터 사전에 구체적인 동의를 받은 범위 내에서만 활용 가능)
 ☐ 데이터 가명처리, 익명처리시 Information Loss 는 반드시 발생
     - 구체적 데이터값을 범주화 시키기 때문에 (예 : 19세 → 10대) Information Loss 발생 (가명화, 익명화 처리의 단점)
     - 정보주체 동의를 받고 결합하는 '개인정보 결합'은 Information Loss 가 존재하지 않음
 
4. 가명처리 기술
 ☐ 가명처리 기술(프라이버시 보호 모델)은 'k-익명성 모델', 'l-다양성 모델', 't-근접성 모델', '차분 프라이버시' 등 존재
     - 'k-익명성 모델' 은 동일한 속성을 가지는 레코드가 최소 k개 이상 존재하도록 하여 프라이버시를 보호
     - 'l-다양성 모델' 은 동질집합의 민감속성정보가 최소 1개의 다양한 속성을 가지도록 하여 'k-익명성 모델'의 취약점(동질성 공격, 배경지식 공격) 을 보완함
     - 't-근접성 모델' 은 특정 동질집합의 기타속성자 분포와 전체 데이터의 기타속성자 분포 차이를 t 이하가 되도록 조정
     - '차분 프라이버시' 는 특정 개인에 대한 사전지식이 있는 상태에서 데이터베이스 질의에 대한 응답 값으로 개인을 알 수 없도록 응답 값에 임의의 숫자 잡음을 추가하여 특정 개인의 존재 여부를 알 수 없도록 하는 기법
 
5. 결합키 (결합키 생성 절차, 결합키 생성 정보 공유금지)
 ☐ 가명 데이터 2개를 결합할 때, 결합키를 통해 결합
     - 상대방과 가명 데이터 결합시, 사전 협의한 방식으로 (결합키 생성 알고리즘, 생성시 활용할 입력정보 등) 결합키 생성/결합
 ☐ 결합키 생성 절차
     ① 결합키 입력정보 선택
          - 결합키는 기본키, 추가선택키로 구성
          - 기본키 : 모든 데이터셋에 대해서 공통적으로 생성하는 결합키 (예시 : 성명, 핸드폰, 생년월일)
          - 추가선택키 : 향후 진행시 이용하기를 원하는 추가 결합키 (예시 : 자택 주소)
     ② 입력값 인코딩 적용
          - 모든 결합키 입력정보에 대해 인코딩 방식 적용
     ③ 솔트값 추가
          - 각 결합키 입력정보에 '별도 안내' 되는 솔트값을 추가
     ④ 결합키 생성 알고리즘 적용
          - 결합키 입력정보 별로 결합키 생성 알고리즘(SHA-256)을 적용하여 16진수(Hex)값으로 생성
 ☐ 결합의뢰기관은 결합키가 포함된 정보집합물을 데이터전문기관에 전달해야 하며, 결합키 생성 정보는 데이터전문기관에 공유 금지
 
6. 사전결합률
 ☐ 주체A 와 주체B 가 가명 데이터를 결합하기 전에 결합키를 이용하여 미리 결합률을 파악
     - 통상적으로 결합키(성명, 핸드폰, 생년월일 등)로 결합 시행 시 20~30%의 정보 손실 발생 (결합률 70~80%)
     - 결합 전에 미리 결합률을 파악하여, 너무 낮을 경우 결합 효용성이 낮기 때문에, 결합을 보류하는 의사결정을 할 수 있음
 
7. 가명데이터 결합 Flow
 (1) 외부 데이터 리스트를 내부에 공유
      - 외부에 어떤 데이터가 있는지 상세 내역을 내부에 공유
         [ To-do List ]
         ⃝ 외부 데이터 리스트를 수령한 내부 담당자들 사전에 지정 필요
         ⃝ 외부 데이터 구매에 대한 Role 을 담당부서 위임전결규정에 추가 필요
 
 (2) 데이터 결합 비즈니스 니즈 발생하면, 해당 비즈니스 ROE 평가
       - 결합 비용이 발생하므로, 비즈니스 ROE 평가를 통과한 경우에 한하여 결합 진행
         [ To-do List ]
         ⃝ 결합 비용 산정 필요
         ⃝ 비즈니스 ROE 평가 기준 필요
         ⃝ 해당 결합 데이터를 어떤 AI 모델을 이용해서 만들지 및 AI 부서의 AI 전문가의 사전 조언을 받는 프로세스 필요
         ⃝ 평가 주체 R&R 위임전결규정에 추가 필요
         ⃝ ROE 평가 통과 후, 마케팅 동의율 관련 합의 프로세스 필요 (개인정보 수집/이용 동의를 추가적으로 받아야 하므로, 마케팅 동의율이 하락할 수 있음)
 
       - 해당 외부 데이터를 가진 업체에게 데이터 구매 관련 사전 문의 및 합의 필요
         [ To-do List ]
         ⃝ 외부 데이터 구매를 위한 해당 업체와의 컨택 및 계약 등에 대한 R&R 정의 및 위임전결규정 추가 필요
        
       - 양쪽 데이터의 결합률도 사전에 체크하여, 유의미한 통계량 확보가 가능한지 여부도 사전에 체크 필요
         [ To-do List ]
         ⃝ 결합키 선정 절차 필요
         ⃝ 유의미한 통계량 기준 결정 필요 (결합 진행할 사전결합률)
 
 (3) 비즈니스 ROE 평가 통과 후, 데이터 구매 비용 등 예산 품의
       - 데이터 구매 비용, 데이터 결합 비용, 데이터 가명화 적정성 심의 위원 섭외 비용, 금융AI라이브러리 저장 비용(연간) 등
         [ To-do List ]
         ⃝ 가명데이터 결합을 위한 예산을 '데이터결합 담당 부서'에서 일괄로 받아두고, 이 예산 내에서 사용할지 or 각 현업 부서가 건별로 예산 품의를 올릴지 의사결정 필요 (가명데이터 결합 활성화를 위해서는 '데이터결합 담당 부서'에서 일괄로 받아두는 것이 효과적)
 
 (4) 예산 확보 후, 데이터 가명화 작업 진행
       - 가명화 시스템을 사용하거나 가명화 전문인력을 두어 가명화 작업을 할 수 있다.(가명화 시스템 비용 or 가명화 전문인력 비용) 가명화 작업이 고난이도 작업이기 때문에 '데이터결합 담당 부서'와 현업 부서가 협업하여 진행해야 함
       - 현업 부서 단독 수행하기에는 고난이도 → 가명데이터 결합 활성화에 허들로 작용하는 가장 큰 요인
         [ To-do List ]
         ⃝ 가명화 작업시, '데이터결합 담당 부서' 가 현업 부서와 같이 진행한다는 프로세스 및 위임전결규정 추가 여부 의사결정 필요
 
 (5) 가명화 완료 후, 사내 가명화 적정성 심의위원회 개최
       - 개인정보보호 내부 담당자 1명 및 2인의 외부 위원 (예 : 금융보안원) 으로 구성된 적정성 심의위원회 개최
 
 (6) 적정성 심의 통과 후, 데이터전문기관에 가명 데이터 송부  
        [ To-do List ]
         ⃝ 데이터를 USB로 전달할지 등 전달 방식에 대한 의사결정 필요
         ⃝ 전달 R&R 의사결정 필요 (현업 부서 전달 or '데이터결합 담당 부서' 전달)
 
 (7) 데이터전문기관에서 데이터를 결합한 후, 당사로 데이터 수령 
        [ To-do List ]
         ⃝ 결합한 데이터에 대한 소유권을 '데이터결합 담당 부서' 가 가져갈지, 현업 부서가 가져갈지 의사결정 필요
         ⃝ 결합데이터를 영구보관을 위해 금융AI데이터 라이브러리에 저장할지 여부 의사결정 필요 (라이브러리 저장시 연간 비용 발생하여 운영비용 확보를 '데이터결합 담당 부서'가 할지, 현업 부서가 할지 의사결정 필요)
         ⃝ 결합데이터를 분석 등의 목적으로 DB에 저장할지 의사결정 (결합 목적 달성시까지만 내부 저장 가능, 목적 달성 후 폐기 의무 발생하는데, 폐기를  '데이터결합 담당 부서'가 할지, 현업 부서가 할지 의사결정 필요)
 
 (8) 가명데이터 결합 관련하여 홈페이지 등에 공시할 의무
       - 가명데이터 결합시, "신용정보의 이용 및 보호에 관한 법률" 제31조(신용정보활용체제의 공시) 에 따라 공시 의무 발생(개인정보보호 담당 부서 Role)
 
8. 필요 인력 및 예산
 ☐ 가명 데이터 결합을 위해 전담 인력 1인 필요
     - 가명 데이터 결합 담당자의 업무는 다음과 같다.
        ⃝ 외부에 어떤 데이터가 있는지 조사 및 이를 내부 현업 부서에 공유
        ⃝ 현업 부서 구매 요청시, 해당 데이터 구매 계약 절차 진행
        ⃝ 데이터 결합 비즈니스 ROE 평가
        ⃝ 해당 데이터에 맞는 AI 모델 사전 점검 및 추천 (AI 전문가 조언)
        ⃝ 데이터전문기관 선정
        ⃝ 사전결합률 체크
        ⃝ 현업 부서와 같이 데이터 가명화 작업 수행
        ⃝ 연간 가명 데이터 결합 예상 확보
        ⃝ 가명 적정성 심의위원회(내부) 지원 (개인정보보호 담당 부서 주관)
        ⃝ 가명 데이터를 데이터전문기관에 전달
        ⃝ 결합 데이터를 데이터전문기관으로부터 수령
        ⃝ 결합 데이터를 목적 달성시 폐기
        ⃝ 결합 데이터를 내부 DB 에 DB화 및 폐기 (DB 담당자 필요)
 
 ☐ 가명 데이터 결합 예산 필요 (연간 운용성 예산 포함)
     - 가명 데이터 결합 관련 비용은 다음과 같다.
        ⃝ 외부 데이터 구매 비용 (조사비용 포함)
        ⃝ 가명 적정성 심의위원 2인 섭외 비용 (가명화 작업마다 발생)
        ⃝ 결합 데이터를 내부 DB 에 DB화 및 폐기 (DB 담당자 비용)
        ⃝ 결합 데이터 영구 보관 결정시, 영구 보관이 유일하게 가능한 금융AI데이터 라이브러리 사용 비용
 
9. 정부 Stance
 ☐ 정부는 "가명 데이터 활용 확대" 기조 하에 점진적 규제 완화 Stance 를 가진 것으로 보임
     - 23년 7월 21일 금융위원회에서 "가명정보 활용 확대방안" 발표
     - 주요 골자는 
        (1) 데이터 확보 어려움 해소
        (2) 가명처리/결합 절차 이행부담 및 제약 요인 개선
        (3) 가명정보 활용 인프라 지원
        (4) 가명정보 재식별/유출에 대한 안전성 확보
     - 정부는 규제 완화책 등으로 가명정보 활용 활성화 의지를 보임
 
 ☐ 규제 완화책이 나온 이유는 가명데이터 결합 건수 증가세 주춤
     - '20년 6건 → '21년 106건 → '22년 115건 →'23년 상반기 60건
     - 데이터 결합 테마도 "대안신용평가시스템" 개발에 집중되어 있으며, 결합 테마의 다양성 부재한 모습을 보임
 
10. 기업 Stance
 ☐ 20년 데이터3법 개정 이후, 가명 데이터 결합에 대해 21년, 22년에는 적극적이었다가, 점차 주춤해진 상태
     - "대안신용평가시스템" 개발 위주로 적극적인 모습을 보였으나, 최근 주춤한 상태
     - 주춤한 이유는 위에서 언급한 "가명처리/결합 절차 이행부담 및 제약 요인", "데이터 확보 어려움" 등이 있음
 
 ☐ 신용정보활용체제 공시에 나온 주요 금융권에서 수행한 가명데이터 결합 사례 내용은 아래와 같으며, 주로 "대안신용평가시스펨" 개발에 집중되어 있음
     - KB국민은행 : 소매 여신심사 및 한도전략 개발
     - 신한은행 : 가계 신용대출 평가모형 개선
     - 현대카드 : 네이버 협력 고객 성향 연구 및 통계 분석
     - 토스 : 신용평가모형 개발 및 분석
     - 카카오 : 금융 관심도, 경제력 예측, 대안신용평가 모형 개발 등을 위한 사전 연구
     - 삼성생명 : 범용 보험 리스크 스코어 연구 및 개발사업 공동추진
     - 교보생명 : 이종산업 간 소비 패턴 및 트랜드 공동 연구를 통해 상품개발, 심사 등 업무에 활용할 통계 분석
     - 신한생명 : 개인신용평가시스템 고도화
     - 삼성화재 : 대안신용평가모형 개발
     - DB손보 : 안전운전 할인특약 상품 개발
     - KB손보 : 신용대출 심사전략 개발
     - 한화손보 : 고객 금융트랜드 분석 및 상품, U/W 관점 통계모형 개발 위한 데이터 결합
     - KT : 가명정보 결합을 통한 신용평가모형 분석
     - LG U+ : 대안 정보를 통합한 신용평가 모형 개발
 
11. 고객 Stance
 ☐ 20년 데이터 3법 개정 후, 고객들은 Toss 같은 Fin-Tech사의 편리한 서비스를 이미 경험/사용 중이며, 사용자가 증가하는 추세
     - 고객들은 이미 사용자 편의성이 좋은 Toss 같은 Fin-Tech사의 서비스를 사용 중이며, Toss 를 통해 마이데이터 전송 동의를 요청하는 고객수도 급증한 상황
     - 하지만, 고객은 개인정보 보안 관련 불안감도 가지고 있음
     - 고객은 보안 관련 불안감과 서비스 편의를 비교하여 서비스 편의가 더 크다면 기꺼이 개인정보를 제공함
 
 ☐ 고객과 회사가 Win-Win 하는 구조이어야 고객은 자발적으로 그리고 지속적으로 본인 개인정보를 제공할 것임
     - 따라서 가명데이터 결합으로 명확한 고객 편의를 제공하는 프로젝트를 추진하는 방향으로 가야 하며, 이런 프로젝트가 아니라면 보안 측면에서 최대한 보수적으로 접근해야 함
     - 보안 관련하여 문제 발생시 고객으로부터 신뢰도 잃고, 낙인 찍힐 수 있음
     - 고객이 자발적으로 개인정보를 제공하는 구조여야, 장기적으로 고객 데이터 정보 수집 비용을 절감할 수 있음
 
12. 전략
 ☐ 정부 규제 완화책과 업계 동향을 F/U하면서, 내부 가명결합 세부 프로세스 및 내부 부서별 R&R 수립을 선행해야 함
     - 향후 가명데이터 결합 확대가 필요한 시점이 올 거라 판단한다면 (DIKW 피라미드에 의하면 결합은 확대될 것임) 이 시점에 대비하여,내부 가명결합 세부 프로세스 및 부서별 R&R 수립을 선행해야 함
 ☐ 지금까지 가명데이터 결합 비즈니스는 신용평가회사가 Drive를 걸면서, 주로 대안신용평가 모델에 집중되었고, 신용평가회사가 업계 전반에 해당 모델을 세일즈함 (대부분 회사 빠르게 도입)
 ☐ 따라서 앞으로 나올 가명데이터 결합 뉴비즈니스도 빠르게 업계 전반에 해당 모델이 퍼질 가능성이 높아서, 급하게 쫓을 필요는 없음 (특허로 확실하게 방어하지 않는다면)
 ☐ 또한 가명데이터 결합의 재식별 가능성 등의 개인정보 이슈가 언제든 발생할 수 있기 때문에, 보수적으로 접근할 필요 존재
 
<가명 데이터 결합 관련법>
- 신용정보의 이용 및 보호에 관한 법률 제17조의2 (정보집합물의 결합 등)
- 신용정보의 이용 및 보호에 관한 법률 제26조의4 (데이터전문기관)
- 신용정보의 이용 및 보호에 관한 법률 제40조의2 (가명처리/익명처리에 관한 행위규칙)
- 신용정보의 이용 및 보호에 관한 법률 제40조의3 (가명정보에 대한 적용 제외)
- 개인정보 보호법 제28조의2 (가명정보의 처리 등)
- 개인정보 보호법 제28조의3 (가명정보의 결합 제한)
- 개인정보 보호법 제28조의4 (가명정보에 대한 안전조치의무 등)
- 개인정보 보호법 제28조의5 (가명정보 처리시 금지의무 등)
- 개인정보 보호법 제28조의7 (적용범위)

반응형

+ Recent posts