연구보고서
텍스트데이터와 인공지능을 활용한 에너지산업 현안 식별 및 트렌드 분석
국가정책연구포털(NKIS)이용에 항상 감사드립니다.
이용하시는 자료는 연구기관의 소중한 연구성과물로 저작권 및 이용조건 등을 준수하여 활용해 주시기 바랍니다.
자료 다운로드를 위해 하단의 자료이용 동의서 및 사용목적 등에 응답 부탁드립니다.
답변하신 내용은 NKIS 정보 활용 현황 및 서비스 분석을 위한 기초자료로 활용됩니다.
감사합니다.
자료 이용 시, 국가정책연구포털(NKIS)에서 제공하는 저작물을 이용하였음을 명시할 것을 동의합니다.
무단으로 연구성과물을 사용하였거나 NKIS에서 제시한 이용조건을 이행하지 않았을 경우,
저작권법에 따라 관련기관에 처벌을 받을 수 있으며, 즉시 저작물의 이용허락을 중지할 수 있습니다.
국가정책연구포털(NKIS)이용에 항상 감사드립니다.
이용하시는 자료는 연구기관의 소중한 연구성과물로 저작권 및 이용조건 등을 준수하여 활용해 주시기 바랍니다.
자료 다운로드를 위해 하단의 자료이용 동의서 및 사용목적 등에 응답 부탁드립니다.
답변하신 내용은 NKIS 정보 활용 현황 및 서비스 분석을 위한 기초자료로 활용됩니다.
감사합니다.
자료 이용 시, 국가정책연구포털(NKIS)에서 제공하는 저작물을 이용하였음을 명시할 것을 동의합니다.
무단으로 연구성과물을 사용하였거나 NKIS에서 제시한 이용조건을 이행하지 않았을 경우,
저작권법에 따라 관련기관에 처벌을 받을 수 있으며, 즉시 저작물의 이용허락을 중지할 수 있습니다.
국문초록
- 1. 연구의 필요성 및 목적
연구의 필요성
○ 세계 에너지 산업이 기후변화 대응, 재생에너지 확대, 첨단기술 도입 등 복합
적인 요인으로 급변하고 있음.
○ 에너지안보 영역에서도 화석연료 수급뿐만 아니라 재생에너지 변동성, 희귀자
원 공급 리스크, 기후 극한 현상 등 다양한 이슈가 동시에 대두되고 있음.
○ 방대한 양의 텍스트(학술논문, 보고서, 뉴스기사 등) 속에서 에너지안보 담론이
어떻게 형성·변화되는지를 체계적으로 파악하고, 토픽 간 시간적·인과적 상호
작용을 분석할 필요성이 높아짐.
연구의 목적
○ 에너지안보 관련 학술 텍스트를 대상으로 토픽모델링(BERTopic)을 수행하여
주요 담론 주제를 추출하고, 전·후 시기에 따른 관심도 변화를 확인함.
○ 시계열 인과관계 분석(PCMCI)을 통해 각 토픽 간 시간차를 둔 영향력을 밝혀
냄으로써, 에너지안보 담론이 동태적 구조로 전개됨을 확인함.
○ 국가별 연구 동향 비교를 통해 에너지안보 담론의 지역적 특성을 파악하고, 향
후 정책 및 기술전망 연구에 참고할 수 있는 기초자료를 제공함.
2. 연구내용 및 주요 분석 결과
BERTopic 분석 및 토픽 분류
○ 2005년부터 2024년까지 약 20년에 걸쳐 Scopus에서 수집한 학술논문 초록
을 분석 대상으로 선정(총 6,951건)
○ BERTopic으로 30개 토픽을 도출하였으며, 에너지안보와 직접적 연관성이 낮
은 1개 토픽을 제외한 최종 29개 토픽을 4가지 대주제로 재분류함.
- 에너지안보 정책 및 전략: (예: T1, T3, T7 등)
- 청정에너지 기술 혁신: (예: T2, T5, T14 등)
- 전력시스템 및 인프라 안정성: (예: T9, T11, T20 등)
- 자원효율성 및 환경 영향: (예: T4, T6, T8 등)
시간 흐름에 따른 토픽 점유율 변화
○ 전기(2005~2014년)와 후기(2015~2024년)로 시기를 구분한 뒤 평균 점유율
차이를 t-검정으로 비교함.
○ 증가한 토픽: 수자원-에너지-식량 연계(T8), 마이크로그리드(T9), 바이오매스
기반 바이오연료(T10), 태양광 발전(T14), AI 활용 신재생에너지 예측(T17)
등은 후기에 관심이 높아지는 추세를 보임.
○ 감소한 토픽: 차세대 원자력(T5), 국제 석유 공급(T18) 등은 후기에 비중이 유
의하게 낮아졌으며, 이는 탈탄소 기조 관련 담론 확산에 기인함.
○ 유의미한 변화가 없는 토픽: 안정적 에너지 확보(T1), 풍력발전(T15), 전기차
(T19) 등은 전기·후기를 통틀어 안정적인 관심 수준을 유지함.
국가별 에너지안보 관련 학술적 관심도
○ 토픽별로 1저자 소속 국가 비중을 살펴본 결과, 중국은 비전통 석유가스(T16),
희토류 금속(T29)에서 가장 높은 비중을, 인도는 바이오디젤(T6), 바이오매스
(T10), 스마트그리드(T11) 등에서 상위권을 차지함.
○ 미국은 수소경제(T2), 바이오연료(T4), 원자력(T5) 등 다방면에서 고른 비중을
보여, 전통 에너지원과 청정에너지원 모두에 대한 연구 역량이 강함.
○ 각 국가별 자원 보유 상황과 정책 우선순위에 따라, 특정 토픽에 대한 집중도
가 달라지는 패턴을 확인할 수 있음.
PCMCI 시계열 인과관계 분석 결과
○ 특정 토픽이 일정 시간차(lag)를 두고 다른 토픽을 양(+)/음(-)으로 변화시키는
연쇄효과가 존재함을 발견
- 예) 풍력발전(T15)이 수소경제(T2)를 후속적으로 상승시키는 반면, 태양광
(T14)이 안정적 에너지 확보(T1)에 대한 단기적 관심 분산 효과를 가져옴.
○ 원자력(T5)과 AI 기반 재생에너지 예측(T17), 바이오디젤(T6)과 온실가스 감
축(T12) 등에서 대체재·보완재 관계가 복합적으로 얽혀 있음을 확인
○ 이는 에너지안보 토픽의 구성이 단순히 독립된 형태가 아니라, 여러 토픽이 상
호작용하며 동태적으로 전개됨을 시사함.
3. 결론 및 시사점
결론
○ 텍스트마이닝(BERTopic)과 시계열 인과추론(PCMCI)을 결합함으로써, 에너지
안보 담론이 시공간적으로 어떻게 형성되고 연결되는지 보다 심층적으로 파악
할 수 있었음.
○ 전 세계적으로 재생에너지와 분산형 전원의 확대, 청정기술 광물 안보 리스크
및 기후변화 이슈가 부각되면서, 전통적 에너지원(원자력·화석연료) 중심의 담
론이 일부 축소되는 반면 새로운 기술·정책 담론이 빠르게 부상함.
○ 국가별 연구 집중도는 해당 국가의 자원 보유·정책 기조에 따라 뚜렷한 차이를
보였으며, 에너지안보 관련 연구는 향후에도 계속해서 다원화·심화될 것으로
예상됨.
시사점
○ 분석 기법 측면: 비정형 텍스트데이터를 활용해 인공지능 기반 토픽모델링 기
법을 통해 주요 담론을 추출하고, 시간지연형 인과관계를 추가적으로 파악하는
방법론은 에너지안보뿐 아니라 타 정책·기술 분야에도 응용 가능함.
○ 데이터 확장: 뉴스, 언론 보도자료 등 학술 이외의 데이터와 정량 데이터(전력
생산량, 온실가스 배출량 등)를 연계하면, 담론과 실제 기술·시장 추이를 더욱
유기적으로 해석할 수 있음.
○ 시스템적 관점: 복수의 토픽 간에 얽힌 네트워크를 시스템 다이내믹스나 계층
적 토픽모델링으로 확장 분석할 필요가 있음. 이를 통해 숨겨진 인과고리와 잠
재적 시나리오를 면밀히 예측할 수 있음.
○ 통합적 에너지안보 전략 요구: 재생에너지 비중 확대, 기후 극한 현상, 사이버
공격 등 다양한 위협 요인이 동시다발적으로 대두되는 상황에서는, 단순 ‘공급
안정성’이 아니라 ‘시스템 회복력’을 핵심 지표로 삼는 통합적 에너지안보 전
략이 필수적임.
○ 정책적 활용: 특정 에너지안보 이슈(예: 풍력·수소·희토류 자원)를 논의할 때,
상호 연관된 다른 토픽의 변화를 함께 고려해야 보다 합리적이고 종합적인 정
책 수립이 가능함.