본문으로 바로가기

연구보고서

보고서명블록체인 기반 연구데이터 플랫폼 구축 방안
  • 1. 서론
    □ 연구데이터 공유 및 활용에 대한 수요가 증가함
    ○ 디지털 기술이 발달하면서 연구데이터 생산 및 축적속도가 빨라지고, 세계적으로 융합연구 및 공동연구가 증가하면서 연구데이터 공유 및 활용에 대한 수요가 증가함

    □ 연구데이터 플랫폼이 있지만 공유 및 활용이 잘 되지 않음
    ○ 국가연구데이터플랫폼, 대분야 전문센터, 소분야 전문센터 등 다양한 연구데이터 플랫폼이 존재하지만 연구데이터 관리체계 부재, 낮은 연구데이터 품질, 보상체계 부재 등으로 인해 연구데이터 공유 및 활용이 활성화되지 않음

    □ 블록체인을 연구데이터 플랫폼에 접목해서 기존의 문제를 해결하고자 하는 시도가 증가함
    ○ 4차 산업혁명 핵심기술로 블록체인이 주목받아왔고, 최근 코로나 19로 인해 주목받고 있는 비대면 서비스에 데이터 투명성 및 무결성을 담보하는 블록체인 도입을 주목하고 있음
    ○ 특히 바이오 분야에서 생명의료와 관련된 연구데이터를 블록체인으로 안전하게 활용하고자 하는 시도가 증가함
    ○ (연구목적) 블록체인이 연구데이터 공유 및 활용에 기여할 수 있는 부분을 파악하고, 블록체인 기반 연구데이터 플랫폼 구축 방안을 제시함
    2. 연구데이터 플랫폼 구축 현황
    □ 연구데이터를 ‘연구개발 전 과정에서 생산·활용된 모든 형태의 연구자료’로 정의함
    ○ 광의의 개념을 사용한 이유는 연구결과 재현에 필요한 사실 기록뿐만 아니라 연구개발 과정에서 생산·활용되는 다양한 형태의 연구자료의 가치도 높아지고 있기 때문임

    □ 연구데이터 플랫폼은 ‘다양한 수요자들이 연구데이터를 활용해서 가치를 교환할 수 있도록 구축된 환경’임
    ○ 플랫폼은 참여자들이 서로 원하는 가치를 얻을 수 있도록 매개하는 토대임
    ○ 일반적인 플랫폼 생태계에는 생산자, 소비자, 공급자, 소유자가 존재함
    ○ 국내 연구데이터 플랫폼 생태계는 공공중심으로 구성되어 있고, 공급자, 관리자, 수요자가 주요 이해관계자임
    - 연구데이터 플랫폼에서는 주로 국가연구개발사업을 통해 생산된 연구데이터를 다루고, 사업을 추진한 주체가 공급자가 됨
    - 연구데이터를 수집·저장·관리 등을 하는 연구데이터 플랫폼 운영자가 존재하고, 정제된 연구데이터를 활용하고자 하는 수요자가 존재함
    - 연구데이터에는 주요 연구결과 및 연구 노하우가 포함되어 있기 때문에 아직 민간이 연구데이터를 공유하거나 판매한 경우는 적음

    □ 주체별 연구데이터 공유 및 활용에 대한 애로사항이 다름
    ○ 관리자는 체계적인 관리체계부재, 공급자는 연구데이터 곡해와 오용에 대한 우려, 시간·예산 부족, 수요자는 낮은 연구데이터 품질이 주요한 애로사항임

    유형
    주요이슈
    연구데이터 관리
    ● 연구데이터를 생산 후 표준화된 절차 없이 단순 관리되고 있음
    ● 개인이나 연구실 차원에서 연구데이터를 관리하는 경우가 많아서 유/손실 되는 경우가 많음
    ● 연구데이터를 전문적으로 관리할 수 있는 인력 및 예산 부족
    ● 망분리 등 보안상의 문제로 클라우드 서비스 이용이 어렵고 연구데이터 저장 및 분석에 필요한 지원 부족
    연구데이터 공유
    (공급자 입장)
    ● 연구데이터 공유에 대한 공로 인정 문화 부재
    ● 연구데이터 공유에 따른 경제적 인센티브 부재
    ● 타연구자의 연구데이터 곡해와 오용의 우려
    ● 연구데이터 공유 내역 확인 어려움
    ● 연구데이터 공개로 출판기회 상실 및 노하우 유출 우려
    ● 연구데이터 공유에 소비되는 시간/예산 부족
    ● 연구데이터 공유 플랫폼 부재
    ● 연구데이터 공유 절차나 규정 미비
    ● 연구데이터를 개인 연구자의 소유라고 생각하는 인식
    ● 연구데이터 공유에 대한 책임이 부담스러움
    ● 연구데이터에 개인정보나 기밀정보가 포함되어 있어서 공유할 수 없음
    ● 연구데이터 소유권 및 이용권에 대한 명확한 규정이 없음
    연구데이터 확보 및 활용
    (수요자 입장)
    ● 연구데이터가 대용량일 경우, 이를 빠르고 안전하게 확보하기 어려움
    ● 연구데이터를 요청하는 과정이 복잡하고 까다로움
    ● 연구데이터 신뢰성 확보(연구데이터 품질)
    ● 연구데이터가 정제되어 있지 않거나 표준화되어 있지 않음
    ● 연구데이터 일부만 공개되거나 접근이 어려움
    ● 연구데이터 위치 및 보유여부를 확인하기 어려움
    ● 연구데이터 활용에 대한 기준이 부재
    <표> 연구데이터 관리, 공유, 확보 및 활용 관련 주요 이슈

    □ 해외 주요국의 연구데이터 정책 및 플랫폼은 각국의 오픈사이언스 정책과 연계되어 있고, 연구데이터 특성을 고려해서 연구데이터 플랫폼을 구축 및 운영하고 있음
    ○ 미국은 연구지원기관별, 연구 분야별로 연구데이터를 따로 관리하고, 영국은 통합 연구데이터 플랫폼(Research fish)을 구축해 운영함
    ○ 유럽연합은 연구데이터 플랫폼에 투자를 확대하고 있고, 자발적인 연구데이터 공유 문화를 형성하기 위해 노력함
    ○ 호주는 연구데이터를 과학분야 뿐만 아니라 인문사회 분야도 포함하고 있고, 호주와 일본은 연구데이터 생애주기별로 지원서비스를 마련함


    국가
    추진 및 지원조직
    특징
    플랫폼 예시
    미국
    ● 추진기관: 연구지원기관(NSF, NIH 등)
    ● 지원기관: 정책추진기관, 연구기관, 대학
    ● 연구분야별로 데이터 센터 및 리포지토리가 세분화되어 있음
    ● 국가차원의 연구데이터 플랫폼이 없음
    ● NSF의 Big data Regional innovation hub
    영국
    ● 추진기관: UKRI
    ● 지원기관: DCC, JISC, 대학도서관 등
    ● 국가차원에서 연구데이터 플랫폼을 구축하고 운영함
    ● 연구데이터 공유 및 활용 지침이 구체화되어 있음
    ● 연구분야 특성에 맞게 플랫폼을 상이하게 구축함
    ● 연구기관과 연구위원회 간 강한 연계
    ● (UKRI 공동 플랫폼) Research Fish
    유럽연합
    ● 추진 및 지원기관: 유럽연합, EC, EOSC
    ● 지속적인 투자와 공동 연구 연구데이터 활용 방안을 마련
    ● 자발적인 연구데이터 공유 및 활용 문화
    ● OpenAIRE
    호주
    ● 추진기관: ARC, NHMRC
    ● 지원기관: ARDC
    ● 연구데이터 생애주기별 지원 서비스 구축
    ● 과학기술뿐만 아니라 인문사회 연구데이터까지 포함
    ● Data.gov. au
    ● ANDS
    일본
    ● 추진기관: 연구지원기관(JST 등)
    ● 지원기관: NII
    ● 연구데이터 관리, 저장, 검색 플랫폼을 구축함
    ● 사회문제해결에 기여하는 성과 창출을 강조
    ● RCOS
    <표> 해외 주요국의 오픈사이언스 관련 연구데이터 정책

    3. 연구데이터 플랫폼에 블록체인 적용 가능성
    □ 국내외 공공 및 민간 기관들은 블록체인의 기술적 한계점을 극복하기 위해 오픈 플랫폼, 정부주도 인프라 지원, 규제 샌드박스 등 다양한 시도를 함
    ○ 블록체인 기술 경쟁력 측면에서는 대규모 데이터 분산저장 기술, 스마트계약 검증 기술, 산업화 융합기술 등이 고려됨
    ○ 코로나 19로 인한 비대면 경제 활성화로 분산신원증명서비스(DID) 도입과 관련된 정책이 확산되고 있음


    구분
    「블록체인 기술 발전전략」(18.6)
    「블록체인 기술 확산 전략」(20.6)
    시장형성
    ● 공공선도 사업 추진(축산물, 부동산거래, 해운물류, 개인통관)
    ● 민간주도 혁신성장 선도사업 추진(스마트공장, 핀테크, 드론, 미래자동차 등 8개 분야)
    ● 7대 분야 전문도입(온라인 투표, 기부, 사회복지, 신재생에너지, 금융, 부동산거래, 우정)
    ● 분산신원증명서비스 활성화
    ● 기업 통합지원체계 구축
    기술 경쟁력 확보
    ● 기반기술(고성능 저비용 합의기술, 스마트계약 검증 기술, 양자저항성을 가지는 암호기술)
    ● 확장기술(대용량 데이터 처리 기술, 대규모 서비스 제공을 위한 확장성 확보 기술, 상호 운용성 확보기술)
    ● 서비스 기술(거래 추적 및 분석 기술, 산업분야별 기존 시스템 연동 기술, 전략 서비스 분야별 특화 블록체인)
    ● 원천기술개발(탈중앙화 고성능· 합의 기술 개발, 스마트 취약점 자동 탐지 기술, 신원관리 기술 및 프라이버시 보호 기술, 대규모 데이터 분산저장 기술)
    ● 산업화융합기술(블록체인+IoT, 빅데이터, AI, 대규모 데이터 유통체인, 글로벌 무역거래 체인)
    기반조성
    ● 핵심인력 양성
    ● 전문기업 육성
    ● 법제도 개선(규제개선 연구반 운영, 세제 지원)
    ● 대국민 인식제고
    ● 전문인력 양성
    ● 시범사업 추진(규제자유특구 연계, 민간 시범사업 운영)
    ● 법제도 개선(규제 샌드박스 연계, 가이드라인 제작, 가상자산사업자 정보보호관리체계(ISMS) 인증체계 마련)
    ● 대국민 인식제고
    <표> 블록체인 기반 연구데이터 플랫폼 관련 주요 정책 내용

    □ 블록체인을 통해 개인정보 보호, 연구데이터 거래 활성화, 대용량 연구데이터 공유 등 연구데이터 공유 및 활용을 활성화할 수 있는 가능성이 있음
    ○ 연구데이터에 포함되어 있는 개인정보나 보안자료에서 최소한의 정보만 선택적으로 증명하고 안전하게 활용할 수 있는 영지식 증명 방식
    ○ 연구정보 주체의 데이터 통제권을 강화할 수 있는 DID
    ○ 대용량 연구데이터를 안전하게 경제적으로 공유할 수 있는 클라우드 분산저장기술
    ○ 연구데이터 위변조를 막는 전자서명과 해시함수
    ○ 연구데이터를 빠르고 경제적으로 거래할 수 있도록 지원하는 스마트계약

    4. 블록체인 기반 연구데이터 플랫폼 혁신사례조사
    ○ 바이오헬스 분야 혁신사례 조사를 통해 의료정보에 블록체인을 도입한 목적, 구현방법, 사례별 특징을 조사함
    - 전자의료정보부터 유전체 정보까지 다양한 의료정보를 안전하게 보호하고, 활용하기 위해 블록체인 기술을 활용함
    - 해외 기업은 주로 이더리움의 스마트계약을 사용해서 거래조건을 자동으로 이행할 수 있도록 설계함
    - 일부 기업은 블록체인 기술과 AI, IoT 등과 결합해서 서비스를 확장시킴
    - 애로사항으로는 의료기관에 저장된 정보 활용 어려움, 블록체인 서비스 운영비용 부담 등이 있었음

    구분
    Medicalchain
    Genomes.io
    Doc.ai
    Modum
    국가
    영국
    영국
    미국
    스위스
    창업시점
    2017년
    2018년
    2016년
    2016년
    주요 서비스
    퇴원요약서 등 전자의료기록 관리 시스템
    유전체정보 저장 및 활용
    블록체인 및 AI 기반 건강데이터 헬스케어 서비스
    의약품 배송공정 모니터링
    활용 데이터
    전자의료기록 (EHR)
    유전체 정보
    (genomic data)
    개인 건강데이터(건강정보, 혈액검사, 유전체, 의약품 복약 정보 등)
    의약품 배송과정 모니터링 데이터
    대상
    환자
    개인
    개인, 연구기관
    의약품 발송 및 수취 업체
    블록체인 활용 이유
    개인정보 보호 및 위변조 방지, 정보주체인 환자 권한 강화
    유전정보 보호 및 위변조 방지, 유전정보의 활용 촉진
    건강정보 보호 및 위변조 방지, 건강정보 공유를 바탕으로 한 연구 촉진
    의약품 배송과정 모니터링 정보 보호 및 위변조 방지
    블록체인 플랫폼
    하이퍼레저 패브릭, 이더리움
    이더리움
    이더리움
    이더리움
    스마트계약 사용 여부
    O
    O
    O
    O
    보상체계
    MTN(ERC-20)
    -
    NRN(ERC-20)
    MOD(ERC-20)
    강점 및 특징
    - 의사 CEO
    - 다양한 서비스 보유(원격의료, 의료 데이터 마켓)
    - 환자 데이터 권한 제공
    - 의사 CEO
    - 유전체 분석부터 공유까지 서비스 제공
    - 이중 보안 장치 보유
    - 스타트업 투자 경험 다수의 CEO
    - AI기술과 블록체인 기술 결합으로 서비스 확장성이 높음
    - IoT와 블록체인을 결합한 의약품 배송 서비스 도입 최초
    - 파일럿테스트를 통한 성능 검증
    <표> 해외 바이오헬스 연구데이터 블록체인 사례 정리


    구분
    메디블록(MediBloc)
    휴먼스케이프(Humanscape)
    창업시점
    2017년
    2016년
    주요 서비스
    환자 및 병원 의료정보 통합 관리
    (마이팔레트, 닥터팔레트, 메디패스)
    희귀난치성질환 환자 데이터 플랫폼
    (레어노트, 레어하우스, 마미톡, 미세톡톡)
    활용 데이터
    의료기관용 및 환자용 진료기록 데이터
    환자가 직접 기록한 건강데이터(PGHD)
    대상
    의료기관, 환자, 보험사
    병원, 제약사, 연구기관, 민간기업, 희귀난치성질환 환자 및 커뮤니티
    블록체인 활용 이유
    개인정보 보호, 신원 인증, 데이터 위변조 방지
    개인정보 보호, 데이터 위변조 방지, 보상체계
    합의알고리즘
    DPoS
    PoA
    블록체인 플랫폼
    페너시어(Panacea)
    이더리움, 클레이튼, 루니버스
    스마트계약 사용 여부
    O
    O
    보상체계
    MED
    HUM
    강점 및 특징
    - 의료기관용 및 환자용 데이터 통합 솔루션 제공
    - 자체 블록체인 플랫폼 운영
    - 머클 증명(Merkle proof)을 통해 특정 데이터 검증만으로 신뢰성 입증 가능
    - 환자가 직접 업로드 한 건강데이터 수집
    - HUM토큰(HUM), HUM포인트(HP), HUM도네이션포인트(DP)의 3가지로 구성된 보상체계로 기부 활성화 및 데이터 어뷰징(abusing) 최소화
    애로사항
    - EMR, EHR 데이터 접근성 제한
    - 바이오헬스 공공 연구데이터 접근성 낮음(ex. 건강보험공단 데이터)
    - 블록체인 노드 관리 비용 부담
    - 법, 제도 관련 전문가 활용 비용 부담
    - 병원을 통한 유전자 정보 확보 과정 복잡
    <표> 국내 바이오헬스 연구데이터 블록체인 사례 정리


    ○ 연구노트 분야 혁신사례 분석을 통한 주요 시사점은 아래와 같음
    - 첫째, 블록체인 기반 연구노트 시스템을 도입하기 위해서는 전자연구노트의 확산이 필수 선결과제
    - 둘째, 클라우드 서버 유지비용의 절감 방안이 필요함
    - 셋째, 블록체인 기반 연구노트 공유 시스템 구축을 위해 보상체계가 필요
    5. 블록체인 기반 연구데이터 플랫폼 수용성 모형 개발 및 결정요인 분석
    ○ 블록체인의 사회적 수용성에 영향을 미치는 요인을 파악하고, 그 효과를 실증분석하기 위해 TAM기반 수용성 모형을 개발함
    - 결정요인 중에서 사용의향에 가장 큰 영향력을 미치는 것은 유용성임
    - 사회적 규범은 인지된 위험 수준을 낮추고 사용의향을 높임
    - 사용의 용이성은 유용성을 높이고 사용 의향을 높이는 데 유의한 변수임
    - 전자연구노트 사용유무로 그룹을 나누어 분석한 결과, 두 집단 모두에서 유용성이 사용의향에 미치는 효과가 가장 컸으며 집단 간의 연구 모델 경로의 통계적 차이는 없었음


    주: 1) RISK → INT (p <0.05)를 제외한 모든 경로 p <0.01미만에서 유의 (선 굵기는 상대적인 영향력의 강도를 보여주는 것으로 굵은 수록 큰 영향력)
    주: 2) PU(유용성), PEOU(사용용이성), RISK(잠재적위험), SN(사회적규범), INTENTION(사용의향)

    6. 블록체인 기반 연구데이터 플랫폼 구축 방안
    ○ 수요 기반 연구데이터 플랫폼 목적 및 범위를 설정함
    - (이슈) 기존 연구데이터 플랫폼은 주체별 상이한 수요를 반영하지 못하였음
    - (대안 1) 1) 수요 발굴, 2) 수요 구체화 및 유형화, 3) 주요 수요자 결정 과정을 통해 블록체인 기반 연구데이터 플랫폼 목적 및 범위를 설정함
    - (대안 2) 연구데이터 플랫폼에서 공공과 민간의 역할을 명확히 구분하고, 민간이 공공 연구데이터 플랫폼에 참여하게 하려면 인센티브 구조가 마련되어야 함
    ○ 블록체인 특성을 고려해서 우선 적용 분야를 선정하고 운영체계를 마련함
    - (이슈) 연구데이터 수집 어려움, 표준화된 관리체계 부재 등 블록체인으로 해결하기 어려운 연구데이터 공유 및 활용 관련 이슈가 있음
    - (대안 1) 1)연구데이터 수집 가능성, 2) 표준화 정도, 3) 용량 및 생산속도 등을 기준으로 블록체인 우선 도입 분야를 선정함
    - (대안 2) 연구데이터 품질을 관리할 수 있는 블록체인 전문 데이터 큐레이션이 필요함
    ○ 블록체인 기술 구현 가능성 고려
    - (이슈) 연구데이터 공유 및 활용을 위해 구체적으로 어떤 블록체인 기술 혹은 서비스가 있는지 파악하고, 도입 가능성을 살펴봐야 함
    - (개인정보활용) DID + 영지식 증명을 통해 개인정보보호를 보호하면서 활용함
    - (대용량 데이터) 클라우드 기반 분산저장 기술을 통해 대용량 연구데이터 저장 및 전송
    - (위변조 방지) 해시값 비교를 통해 연구데이터 위변조를 원천적으로 막음
    - (보상 및 비용 절감) 스마트 계약을 통해 연구데이터 보상 및 공유 비용 절감

    연구데이터 주요 이슈
    블록체인 관련 동향
    (개인정보보호) 개인정보 및 기밀정보가 포함되어 있어서 공유하기 어려움
    ● (정책) 혁신금융 서비스 사업(금융위원회), 블록체인 R&D사업(과기정통부), 전자증명서사업(행정안전부)
    ● (산업) 스위스 전자신분증, 캐나다 Sovrin 네트워크, 아이콘루프 디패스, SK텔레콤 이니셜, 코인플러그 DIDaaS, 라온시큐어 옴니원 등
    (접근성) 연구데이터 위치 및 보유 현황을 파악하기 어려움
    (대용량 데이터) 연구데이터 용량이 커서 빠르고 안전하게 데이터를 확보하거나 전송하기 어려움
    ● (정책) 대규모 데이터 분산저장 및 고속분석 기술(과기정통부)
    ● (산업) 파일코인(Filecoin), 스토리지코인(storj), 디피니티(Dfinity), 시아코인(Sia)
    (품질 보장 및 위변조 방지) 생산된 연구데이터 품질을 신뢰하기 어렵고, 공유 및 활용되는 과정에서 곡해나 오용될 가능성이 있음
    ● (정책) 블록체인 7대 분야 전면 도입
    ● (산업) 메이커토큰(Maker Token), 오라클라이즈(Oraclize), 체인링크(Chainlink)
    (보상) 연구자들은 보상없이 연구데이터를 공유하고자 하는 의지가 적음
    ● (산업) 이더리움 스마트계약, 다양한 종류의 토큰
    <표> 블록체인 적용 가능한 연구데이터 주요 이슈


    ○ 유용성, 사용용이성 향상을 통해 사회적 수용성 확대
    - (문제) 블록체인 기반 연구데이터 플랫폼의 사회적 수용성이 낮음
    - (대안 1) 기존 플랫폼과 차별화된 서비스를 개발하고, 사용자 수가 임계점(Critical mass)에 도달할 때까지 지속적으로 기술개발이 필요함
    - (대안 2) 사용용이성을 높일 수 있는 UX/UI개발이 필요함
    ○ 블록체인 서비스 개발·배포·관리 지원 방안 마련
    - (문제) 중소기업이 블록체인 서비스를 구축하는 비용을 감당하기 어려움
    - (대안) 기업이나 기관이 블록체인 서비스를 개발·배포·관리할 수 있도록 공공 블록체인 인프라 지원 서비스가 필요함
    ※ 중국 블록체인서비스네트워크(BSN): 기업이나 기관이 표준화된 블록체인 서비스를 개발할 수 있도록 지역 인터넷 망, 클라우드 서비스 등을 지원함

콘텐츠 큐레이션 : 동일주제 가장 많이 이용된 자료 추천

현재 페이지에서 제공되는 연구보고서에 대하여 평가해 주세요

의견(0)

연구성과에 따른 의견과 무관한 글, 선정적인 글 및 비방글 등의 게시물은 관리자에 의해 언제든 삭제 조치 될 수 있으며, 주민등록번호 형식 및 연속된 숫자 13자리는 입력할 수 없습니다.

입력 가능 Byte : 4000 Byte 현재 입력 Byte : 0 Byte
자동등록방지 숫자를 순서대로 입력하세요.