HEaaN

동형암호는 암호문 간의 연산을 지원 함으로써 데이터의 수집, 보관, 그리고 가공을 하는 과정에서 평문이 노출되지 않는다는 장점을 가지고 있습니다. 이로 인해 클라우드 컴퓨팅과 빅데이터의 활용 분야 중 개인정보를 보호해야 할 필요가 있는 응용에 있어서 활발한 연구와 개발이 이루어지고 있습니다. 데이터를 암호화 하지 않고 직접 연산 하는 것에 비해서 처리해야 하는 데이터의 양과 연산 수행에 걸리는 시간에 있어서 감수해야 하는 비효율성을 최소화 하는 것이 동형암호 알고리즘의 중요한 성능 척도 중 하나입니다.

IDASH
  • 주최

    UCSD Medical School

    UCSD Medical School

  • 후원

    미국 국립보건원

    미국 국립보건원

  • 목표

    정보유출 없이 클라우드 컴퓨팅으로
    유전정보를 분석

혜안은 이러한 성능척도에 있어서 가장 뛰어난 성능을 보임으로써 ISO (International Standard Organization), ITU (International Telecommunication Union) 그리고 IETF (Internet Engineering Task Force)와 같은 세계적인 표준화 단체의 후보 알고리즘으로 채택되고 있습니다. 혜안은 효율적인 실수연산을 가능하게 하는 최초의 동형암호 알고리즘으로서 학계와 세계적인 경진대회를 통해 그 우수성이 입증되고 있으며, 14개의 특허를 통해 원천기술을 확보하고 있습니다.

혜안은 보유 특허기술을 바탕으로 기본적인 암호화/복호화 기능과 암호문 간의 실용적인 연산들을 효율적으로 수행할 수 있도록 하는 모듈을 탑재할 수 있게 설계되어 있습니다. 혜안이 제공하고 있는 대표적인 암호문 간의 연산들은 덧셈/곱셈/회전, 재부팅, 기초통계, 로지스틱 회귀 (Logistic Regression), 그리고 기계학습 등이 있습니다. 혜안은 이러한 핵심적인 기능들을 최적화 한 라이브러리와 다양한 응용분야에 최적의 적응성을 제공하는 효과적인 소프트웨어 아키텍처를 가진 모듈들을 포함하며 금융 및 의료와 같은 중요한 응용 시스템에 적용할 수 있도록 지원하는 API (Application Programming Interface)와 해당 시스템에 최적화 할 수 있도록 돕기 위한 다양한 기술백서들을 제공합니다.

동형암호의 원리동형암호의 원리
2017 TRACK 3 : BEST-PERFORMING TEAMS

Evaluated on (three datasets of 1422 records for training/157 records for testing + 18 features)

2017 TRACK 3 : BEST-PERFORMING TEAMS
Teams AUC
0.7136
Encryption Secure learing Decryption Overall time
(mins)
Size(MB) Time
(mins)
Time
(mins)
Memory
(MB)
Size
(MB)
Time
(mins)
SNU 0.6934 537.667 0.060 10.250 2775.333 64.875 0.050 10.360
CEA LIST 0.6930 53.000 1.303 2206.057 238.255 0.350 0.003 2207.363
KU Leuven 0.6722 4904.000 4.304 155.695 7266.727 10.790 0.913 160.912
EPFL 0.6584 1011.750 1.633 15.089 1498.513 7.125 0.017 16.739
MAR 0.6574 1945.600 11.335 385.021 26299.344 76.000 0.033 396.390
Waseda* 0.7154 20.390 1.178 2.077 7635.600 20.390 2.077 5.332
Saarland N/A 65536.000 16.633 48.356 29752.527 65536 7.355 57.344

* Interactive mechanism, no complete guarantee on 80-bit security at “analyst” side

** Program ends with errors

2018 TRACK 2 : Secure Parallel Genome Wide Associaion Studies using Homomorphic Encryption
Team Submission Schemes End to End Performance Evaluation result (F1-Score)
at different cutoffs
Running time
(mins)
Peak Memory
(M)
0.01 0.001 0.0001 0.00001
Gold Semi Gold Semi Gold Semi Gold Semi
A*FHE A*FHE -1 + HEAAN 922.48 3,777 0.977 0.999 0.986 0.999 0.985 0.999 0.966 0.998
A*FHE -2 1,632.97 4,093 0.882 0.905 0.863 0.877 0.827 0.843 0.792 0.826
Chimera Version 1 + TFHE & HEAAN
(Chimera)
201.73 10,375 0.979 0.993 0.987 0.991 0.988 0.989 0.982 0.974
Version 2 215.95 15,166 0.339 0.35 0.305 0.309 0.271 0.276 0.239 0.253
Drlft Blue Delft Blue HEAAN 1,844.82 10,814 0.965 0.969 0.956 0.944 0.951 0.935 0.884 0.849
UC San Diego Logistic Regr + HEAAN 1.66 14,901 0.983 0.993 0.993 0.987 0.991 0.989 0.995 0.967
Linear Regr 0.42 3,387 0.982 0.989 0.980 0.971 0.982 0.968 0.925 0.89
Duality Technologies  Logistic Regr + CKKS (Aka HEAAN),
pkg:palisade
3.8 10,230 0.982 0.993 0.991 0.993 0.993 0.991 0.990 0.973
Chi2 test 0.09 1,512 0.968 0.983 0.981 0.985 0.980 0.985 0.939 0.962
Seoul National University SNU-1 HEAAN 52.49 15,204 0.975 0.984 0.976 0.973 0.975 0.969 0.932 0.905
SNU-2 52.37 15,177 0.976 0.988 0.979 0.975 0.974 0.969 0.939 0.909
IBM IBM-Complex CKKS (Aka HEAAN),
Pkg:HEIIB
23.35 8,651 0.913 0.911 0.169 0.188 0.067 0.077 0.053 0.06
IBM-Real 52.65 15,613 0.542 0.526 0.279 0.28 0.241 0.255 0.218 0.229

HEaaN.STAT

HEaaN.STAT

혜안은 개발 초기부터 다양한 기업들과의 협업을 통해 실무에 적합한 형태로 설계되어 왔고 이로 인해 본래 가진 기능과 성능을 잃지 않고 고객사의 업무에 적용할 수 있도록 지원합니다. 동형암호의 주된 특징인 암호문 간의 연산들 중에서 가장 기본적이고 빈번히 사용되며 많은 응용에서 필요로 하는 기능들 중 하나가 기초통계입니다.

혜안 라이브러리를 사용하는 혜안 제품군들 중에서 이러한 기초통계를 비롯해서 암호문 간의 정렬과 로지스틱 회귀 등의 기능을 제공하는 제품이 HEaaN.STAT입니다. 이는 금융권과의 협업을 통해서 이미 그 실용성과 효용성이 입증되고 있습니다.

HEaaN.ML

개인정보가 보호되는 기계학습은 인공지능을 활용하고자 하는 다양한 산업계에서 그 필요성과 중요성을 인정받고 있습니다. 이러한 문제를 해결하고자 하는 다양한 기술적 접근들 중에서 HEaaN.ML은 동형암호를 활용한 기계학습 기능을 통한 솔루션을 제공합니다. HEaaN.ML은 프로그램 별로 DNN (Deep Neural Network), CNN (Convolutional Neural Network), RNN (Recurrent Neural Network), 그리고 random forest 등의 기능을 제공하며 그 성능 향상을 위해서 학계는 물론 하드웨어 업체와의 공동연구를 통해 GPU (Graphics Processing Unit)를 활용하는 방법과 FPGA (Field Programmable Gate Array)를 통해 고성능 반도체를 공급하는 것을 진행하고 있습니다.

Learning Phase
데이터, 머신러닝, 함수데이터, 머신러닝, 함수
Prediction Phase
개인데이터x, 함수, 함수값개인데이터x, 함수, 함수값

Demo Site – HEaaN Platform

HEaaN.STAT은 기본적인 동형암호 기능을 기반으로 한 통계연산 기능과 기계학습 기능의 로지스틱 회귀 (Logistic Regression)를 제공합니다.
HEaaN.STAT을 사용해서 제품 및 서비스를 개발하기 위한 고객들을 위해서 웹 상에서 기능을 체험해 볼 수 있는 데모 사이트를 운영하고 있습니다.

데이터 소유자, 데이터 서비스 제공자, 키 관리자데이터 소유자, 데이터 서비스 제공자, 키 관리자

위 그림은 HEaaN.STAT의 사용 유형별 조직을 나타낸 다이어그램으로서, 각 기관에 대한 설명은 다음과 같습니다.

  • 1

    데이터 소유자 (DO: Data Owner): 원문 데이터를 소유하는 기관으로, 원문 데이터를 암호화 하여 데이터 서비스 제공자에게 전달합니다.

  • 2

    데이터 서비스 제공자 (DSP: Data Service Provider): 데이터 소유자에게 받은 암호문 데이터를 사용하여 데이터 분석 서비스를 수행하는 기관입니다.

  • 3

    키 관리자 (KM: Key Manager): 키를 생성하고 비밀키를 관리하는 기관으로, 각 기관에 키를 배포하고 데이터 복호화 서비스를 제공합니다.

HEaaN.STAT에서 제공하는 기본적인 기능은 키 생성, 암호화 및 복호화, 그리고 데이터 병합과 관리를 위한 명령어들이 있습니다. 암호문 간의 연산을 지원하기 위한 기능은 기초 연산, 기본 통계, Bin 통계, 그리고 로지스틱 회귀로 이루어져 있습니다.

  • 1

    기초 연산은 컬럼들 간의 덧셈, 뺄셈, 그리고 곱셈과 상수에 대한 덧셈, 뺄셈, 그리고 곱셈 기능을 지원합니다.

  • 2

    기본 통계는 평균, 분산, 피어슨 상관계수, 백분위수, 그리고 사분위수를 구하는 기능을 제공합니다. Bin 통계와 로지스틱 회귀 및 각각에 대한 자세한 설명은 매뉴얼을 참고하시면 확인하실 수 있습니다.

Link
검색 닫기