홍종욱 / 이청원 북한 역사학 디지털 아카이브 구축 / 2024년도 중견연구자지원사업

홍종욱 / 서울대학교 / 인문학 / 이청원 북한 역사학 디지털 아카이브 구축 / 2024년도 중견연구자지원사업 예비선정

연구목표:

● 디지털 웹 시대에 걸맞은 텍스트 및 콘텍스트 아카이빙
지식인의 저작집 편집 등 텍스트 아카이빙은 지식과 문화 축적을 위해 필수적인 작업이다. 나아가 학술장을 이루는 인물, 문헌, 기관, 개념 등의 관계, 즉 컨텍스트 분석을 통해 지식의 연쇄와 창생의 순간을 파악할 수 있다.
다만 출판 시장 위축으로 저작집 편찬 등은 곤란에 부딪혀 있다. 출판된 책도 종이 매체의 한계로 텍스트와 콘텍스트의 입체적 맥락을 표현하기 어렵다.
구글링에 검색되지 않으면 더 이상 유효한 지식이 아닌 것으로 여겨지는 현실에 비추어, 웹 환경에 주요 문헌의 디지털 정본을 구축할 필요가 있다. 학술장 구성 요소의 관계망 역시 정보 사이의 의미적 관계를 포착하는 시맨틱(semantic) 데이터 아카이빙을 통해 인문학 고유의 맥락을 입체적으로 표현할 수 있다.

● 북한 역사학 연구 축적과 디지털 인문학 방법론의 결합으로 21세기 한국학 쇄신의 계기를 마련
시맨틱 데이터베이스 구축을 중심으로 한 질적 접근은 자연어 처리에 기반한 양적 접근과 더불어 디지털 인문학 방법론의 양대 축이라고 할 수 있다. 시맨틱 데이터 아카이빙은 단순히 구글링의 결과를 해석하는 것을 넘어, 구글에 검색될 만한 (한국어) 콘텐츠를 만드는, 나아가 최근 화제가 되는 (한국어 기반) Generative AI를 충실화할 콘텐츠를 생산할 수 있는 유력한 방법론이다.
북한 역사학은 내용과 형식에서 시맨틱 데이터 아카이빙에 적절하다. 집체 연구라는 방법론, 과학원 역사연구소가 주관하는 논쟁의 전개와 총괄 등은 시맨틱 데이터베이스로 충실히 재현될 수 있다. 아울러 해방 전 일본 학계와의 연속과 단절, 동시대 소련·중국 등 사회주의 학술과 영향 관계 등을 디지털 환경에 충실히 기록한다면, 연구자의 직관을 넘어서는 북한 역사학의 실태가 떠오를 것으로 기대한다.
북한 역사학 연구 축적과 디지털 인문학 방법론의 결합은, 북한 역사학이라는 한국 근현대 역사학의 또 하나의 축을, 디지털 웹 환경에서 이루어지는 21세기 한국학 연구의 자원으로 활용할 길을 열어 줄 것이다.

기대효과:

● 북한 역사학 연구에 새로운 전기 마련
북한 역사학 연구, 나아가 한국 근현대 사학사 연구에 새로운 전기를 마련할 것으로 기대한다. 건국 초기 북한 역사학계에서 핵심적인 위치를 차지하는 이청원의 저작이 디지털 웹 환경에서 검색, 유통, 활용됨으로써 연구의 편의가 크게 향상될 것이다.
이청원과 그 주변의 역사학자, 연구기관, 역사학 논저 등의 상호관계가 시맨틱 데이터베이스로 정리됨으로써, 평면적인 글쓰기로는 표현하기 어려웠던 북한 역사학계의 구조와 실태가 명료하게 드러날 것이다.

● 디지털 시대 한국 인문학 확산의 토대 구축
주요 문헌의 디지털 정본과 학술장 구성 요소의 관계망 그래프 등을 제공함으로써 디지털 시대 한국 인문학 연구의 새로운 방향성을 제시할 것이다. 디지털 아카이브는 미디어 위키를 기반으로 하므로 다수의 사용자가 쌍방향 소통을 하는 경험을 제공할 수 있다. 대학의 인문학 교육 및 연구 플랫폼은 물론 시민의 인문학적 수요에 부응하는 통로로 기능할 것이다.

● 한국학 해외 발신
코로나19 사태를 거치면서 온라인 교육 및 연구 부문이 비약적으로 성장했다. 북한 역사학 디지털 아카이브는 한국학 해외 발신의 기지가 될 수 있을 것으로 기대한다.
신청자는 이번 후속연구의 토대가 되는 유사 연구과제를 해외 학계에 보고한 바 있다. “북한 인문학 데이터 아카이브의 인물 위키 페이지 구축”, 〈아시아-태평양 지역의 북한학 국제 공동연구 세미나 시리즈〉, 호주 The University of Queensland, 2021.6.

연구요약:

연구의 내용 및 방법은 ①이청원 디지털 전집 편찬, ②이청원 북한 역사학 디지털 아카이브 구축, ③북한 역사학 연구와 디지털 인문학의 협업에 관한 논문 집필 등 세 가지 과제를 축으로 한다.

● 제1차 연도: 이청원 디지털 전집 편찬

  • 데이터 입력: 선행연구를 통해 1945년 이후 이청원 저작(논문, 단행본)의 약 90%는 초벌 입력이 되어 있는 상태다. 후속연구 제1차 연도에는 이청원 저작 가운데 미입력분을 입력하겠다. 아직 소재가 확인되지 않은 미수집 저작에 대한 추적도 지속하겠다. 아울러 이청원의 삶과 실천을 이해하는 데 필수적인 관련 자료를 포괄적으로 수집하여 입력하겠다.
  • 디지털 정본 확정: 전통적인 지식인의 저작집은 역사적인 문헌의 정본을 제공함으로써 인문학 연구의 토대를 놓았다. 디지털 저작집 역시 디지털 정본을 제공하는 것을 가장 기본적인 사명으로 한다.
    디지털, 웹 환경의 특징은 텍스트가 구글링을 통해 포착되어 무한 유통된다는 점에 있다. 동기어 분석을 통한 개념사 연구 등의 토대로 활용되기 위해서는 외래어, 개념어 표기 등의 통일에 유념해야 한다.
  • 전자책 편집 및 출판: 현재 유통되는 전자책(e-book)은 대부분 종이책을 그대로 pdf 형식으로 전환한 형태다. 디지털 웹 환경의 장점을 살릴 전자책의 형태는 아직 합의된 방향이 없다. 다만 종이책을 바탕으로 한 서지 표기, 인용 방식의 관성이 강한 현실 탓에 편집 방식의 혁명적인 변화가 어려운 것도 사실이다.
    후속연구에서 편찬할 이청원 디지털 전집 역시 이러한 현실을 감안하여 종이책의 형태를 존중하면서도, 디지털 웹 환경에서의 활용 및 유통을 염두에 두고 충실한 데이터 마크업(레이블링)을 수행하겠다. 문헌 메타 데이터 및 장절·각주 입력 체계도 구축하겠다. 본문의 주요 단어는 하이퍼링크를 걸어 비선형적 독서 경험을 제공하겠다.
    저작권 문제가 해결된다면 원문 화상을 제공하는 것도 검토하겠다. 한자어와 북한 문화어 철자법이 섞여 있는 원문 텍스트 구축은 추후 과제로 남겨둔다.

●제2차 연도 : 이청원 북한 역사학 디지털 아카이브 구축

  • 시맨틱 데이터베이스 구축: 이청원과 그 주변 정보를 온톨로지에 기반한 트리플 데이터로 구축하겠다. 효율적 온톨로지 설계 및 개방적 공유를 위해 OWL(Web Ontology Language)과 OWL 포맷을 지원하는 대표적 온톨로지 설계 도구인 ProtégéTM를 이용하겠다. 이렇게 구축한 지식과 정보의 관계망은 네트워크 그래프로 시각화하겠다.
  • 디지털 아카이브 웹사이트 디자인: 이청원 디지털 전집을 중심에 두고 그것을 둘러싼 역사학자, 연구 및 교육기관 등 정보로 구성된 시맨틱 데이터베이스를 시각화하여 배치하겠다. 웹사이트는 Wiki 소프트웨어를 활용해 구축하겠다.
    디지털 텍스트, 네트워크 그래프 외에 다양한 미디어 확장기능을 탑재하여 이용자의 이해를 돕겠다. 이청원의 생애를 따라가는 타임라인 그래프, 이청원의 이동 경로를 표시한 전자지도 등을 생각할 수 있다. 그밖에 이청원 관련 사진 자료, 동영상을 임베딩하여, 이청원에 대한 온라인 도서관, 기념관이자 박물관, 즉 아카이브를 구축하겠다. 서버, 데이터베이스 등 백엔드는 서울대 인문학연구원이 운영하는 아카이브를 수정하여 활용하겠다.
    향후 보완을 통해 이청원 연구를 넘어 북한 역사학 연구의 플랫폼으로 기능할 수 있도록 설계하겠다.

●제3차 연도 : 북한 역사학 연구와 디지털 인문학의 협업에 관한 논문 집필

  • 학술 논문 집필: 이청원 디지털 전집과 이청원 북한 역사학 디지털 아카이브를 소개하고, 그 구축과정에서 겪은 시행착오를 면밀히 분석하여, 확장과 개선 방향에 대한 제언을 담은 학술 논문을 집필하겠다.
  • 디지털 전집 및 디지털 아카이브에 대한 수정, 보완도 진행하겠다.

키워드:

이청원, 검열, 전향, 숙청, 북한 역사학, 주체사관, 디지털 인문학, 디지털 전집, 디지털 아카이브, 인공지능

Lee Cheong-won, Censorship, Conversion, Purge, North Korean Historiography, Juche Historiography, Digital Humanities, Digital Archive, AI

Leave a Comment