김한샘(연세대) / 20세기 초 한국어 학습서 아카이브 구축과 언어-문화의 사적 고찰 / 2024 인문사회연구소지원사업

김한샘(연세대) / 20세기 초 한국어 학습서 아카이브 구축과 언어-문화의 사적 고찰 / 2024 인문사회연구소지원사업 예비 선정

https://www.nrf.re.kr/biz/notice/view?menu_no=362&page=&nts_no=225837&biz_no=241&target=&biz_not_gubn=result&search_type=NTS_TITLE&search_keyword1=

연구목표:

본 연구는 외국인을 위한 초기 한국어 학습서 아카이브를 구축하여, 초기 한국어 교육 체제와 내용을 총체적으로 연구하고, 한국어 교육의 역사를 고찰하는 것을 목표로 한다. 이를 통해 20세기 초기 한국의 언어・문화적 특성을 분석하고 규명한다. 또한, 이 아카이브를 활용하여 한국어 교육 및 인문학 연구를 지원하는 언어 정보 공유 서비스를 제공하고자 한다.
디지털 인문학에 대한 관심이 높아지는 가운데, 초기 한국어 학습서는 영인본이나 개인 연구자 소장 자료로만 존재하며, 충분히 디지털화되어 있지 않다. 본 연구는 수집된 학습서를 전자 텍스트로 구축하고, 출판 연도, 저자, 내용, 언어적 특성, 사용된 어휘 및 문법 구조 등의 기준에 따라 체계적으로 분류하여 상세한 메타데이터를 생성한다. 이를 통해 연구자들에게 쉽게 접근하고 검색할 수 있는 목록을 제공한다.
구축된 초기 한국어 학습서는 총체적으로 분석하여, 당시의 교재론적, 교수법적, 언어‧문화적 특성을 탐구하고 한국어 교육의 뿌리를 밝힌다. 이를 통해 한국어 교육의 변천사를 체계화하고, 독자적인 교수법을 집대성하여 한국어 교육 이론의 토대를 마련할 수 있을 것이다. 또한 20세기 초 한국어 텍스트로서 학습서에 담긴 다양한 언어 변이를 분석하여, 근현대기 한국어의 양상을 관찰하고, 현대 국어 성립기의 언어적 특징을 규명할 수 있다. 특히, 학습서에 담긴 회화 표현 등은 당시 구어 자료로서의 가치도 높아, 구어 자료가 부족한 당시 한국어의 구어적 특성을 고찰하는 데에도 기여할 것이다.

기대효과:

이 과업은 언어, 사회, 문화적인 통찰과 통섭을 목표로 그 성과가 국가와 사회에 효과적으로 환원, 활용될 수 있도록 하고 본 연구소가 지금까지 수행해 온 국내외 학술적, 인적 소통 자원을 기반으로 사회통합과 화합을 도모할 것이다. 이와 함께 융합학문, 연구방법론, 학제 간 연구 활용의 체계적 방안을 제시하고 이를 후속연구로 이어가는 동시에 적극적인 학문 후속 세대 양성에 주력한다.

○ 기존 아카이브의 제한성 극복: 본 연구소가 구축, 제공하려는 웹 기반 디지털 아카이브는 기존 아카이브들을 통해 활용할 수 있는 원문 수록 이미지와 조건 검색에 더하여 원문 수록 이미지와 해당 텍스트를 함께 구현한다. 이를 통하여 이용자의 목적에 맞는 재가공 및 데이터 마이닝 분석 툴과의 용이한 호환을 도모하고 기존 아카이브의 제한성을 극복하는 한편 나날이 다양화, 전문화 되어가는 미디어커뮤니케이션 플랫폼의 새로운 가치 창출에 기여할 것이다.
○ 근현대 사회・문화 자료의 세계화 토대 마련: 초기 한국어 학습서는 국내외에 걸쳐 그 목적과 대상에 따라 어휘, 문법, 회화서 등과 같은 구체적인 의도에 의하여 작성되었다. 이와 동시에 당시 한국의 사회・문화상이 교육 현장에 고스란히 반영되어 있으므로 급변하는 국제 정세와 질서 속에서 어떻게 교섭하며 근현대 사회로의 이행을 준비하였는지를 발견할 수 있는 사회・문화적 유산이다. 우리는 한국어 학습서를 시작으로 이와 같은 사적 자료의 발굴과 구축을 계속하며 확장성 높은 국제통용 규격으로 구축, 제공함으로써 근현대 사회・문화 자료 세계화의 토대를 마련하고 국가적 위상을 제고해 갈 것이다.
○ 세대・지역 간 이해와 통합의 기반 제공: 현대 한국은 기성세대와 이후의 세대, 특히 해방과 한국전쟁 전후 세대의 공존이 사회와 문화 전반에 기저하고 있다. 이와 함께 근현대사의 갈등을 통한 지역 간 대립과 갈등의 양상 역시 극복되지 않은 것이 사실이다. 이러한 문제를 해결하기 위해서는 정책과 실천의 측면 모두에서 다양한 시도가 필요하다. 본 연구는 초기 한국어교재, 특히 해방 이전의 자료를 발굴하고 자료화하고 그 속에서 의미 있고 중요하게 포착되는 표현들과 그 맥락을 고찰함으로써 자료에 기반하여 세대와 지역 간 이해를 고취하고 통합의 기반을 제공하는 데 일조할 것이다.
○ 이론과 실용의 담론 제공: 본 과업은 응용국어학, 한국어교육학, 국어정보학의 이론과 실제를 적용하여 디지타이징과 언어 주석을 거쳐 데이터 마이닝에 최적화된 웹 기반 디지털 아카이브를 공개 서비스한다. 이 웹 기반 디지털 아카이브는 이미지 및 원문 데이터뿐만 아니라 기본적인 단어, 문장 단위 용례 검색과 형태소 단위 검색 및 통계 분석 기능을 함께 제공할 계획이다. 이에 더하여 자료의 특성상 한글 및 일본어 등 옛 표기가 존재하는 언어에 대해서는 현대 표기를 함께 이용한 상세 검색이 가능하도록 설계함으로써 아날로그 자료의 처리 기술과 학제 간 융복합 및 실용적인 인문학 담론을 제공할 것이다.
○ 한국어와 한국어 교육의 국제적 지평 확장: 국내외 연구 네트워크를 구축하여 다양한 수요와 목적에 부합하는 한국어 학습서 개발 및 지속 가능한 한국어와 한국 문화의 영향력을 확장한다. 이를 통하여 보편성과 특수성이 공존하고 있는 초창기 한국어와 한국어 교육의 다양한 양상과 쟁점에 대한 재발견을 견인하고 한국어 연구와 한국어 교육의 세계화에 앞장서 구축한 데이터를 국제적으로 확산할 것이다.
○ 언어와 문화의 상호작용 연구: 한국어 학습서 자료 발굴과 구축을 통하여 한국어와 한국어 교육의 과거를 관찰하고 이에 드러나는 전환기와 확립기 언어, 사회, 문화 교섭의 제상을 입체적으로 포착함으로써 초창기 국내외 간행 학습서에 대한 관심 함양과 언어를 통한 근현대 문화의 다양한 상호작용을 구명하는 후속 연구로 발전시킬 것이다.

연구요약:

본 연구는 20세기 초 외국인을 위한 한국어 교육 학습서 아카이브 구축을 통해 당시의 언어·문화를 역사적으로 분석하는 것을 목적으로 한다. 종이 또는 영인본으로 남아 있는 초기 한국어 교육의 역사적 자료를 텍스트 파일 형태로 제작·보존하고 이를 기반으로 한 언어 처리 및 연구 결과를 공유하여 한국어 교육 및 인문학 연구에 필요한 자료 기반 연구를 지원하고자 한다. 구체적인 연구 내용은 다음과 같다.

○ 자료 발굴 및 목록 작성: 국내외 도서관, 아카이브, 개인 소장가 등을 통해 한국어 학습서 관련 자료를 조사한다. 수집된 자료를 출판 연도, 저자, 학습서 내용, 언어적 특성, 사용된 어휘 및 문법 구조 등의 기준에 따라 체계적으로 분류하고 상세한 메타데이터를 생성하여 연구자들이 쉽게 접근하고 검색할 수 있는 목록을 생성한다.
○ 학습서의 디지털화: 선별된 학습서를 고해상도 스캐너를 사용하여 이미지 파일로 변환하고 OCR 처리한 후, 이를 기반으로 학습서 내용을 텍스트 파일로 생성할 것이다. 발간된 시대나 쓰여진 언어의 종류, 학습서의 성격별로 학습서의 형식이 상이하므로 이를 포괄하는 체계를 만들어 내용을 구조화한다.
○ 언어 주석: 한국어 학습서에 출현한 언어 단위를 효과적으로 분석하고 활용하기 위한 필수적인 과정이다. 형태소 및 단어 단위를 분절하고 각각의 범주를 표시하는 것을 목표로 하여 분석 대상과 그에 맞는 태그셋을 확정하고 이에 따라 주석 작업을 진행한다. 이를 통해 학습서 내용의 체계적인 분석 및 유연한 검색이 가능해질 것이다.
○ 학습서 내용 분석: 교재론적 측면에서 각 학습서가 다루고 있는 학습 주제와 내용을 분석하여, 당시 학습서를 통해 교육하고자 했던 핵심 언어 요소와 교육 내용 체계를 파악하고 학습서에 총체적으로 녹아 있는 교육 철학과 목표, 교육 내용, 평가 체계 등을 포착할 수 있으며 당시부터 현재에 이르기까지 한국어 교육과정의 발달 과정에 대한 사적 고찰 자료로 활용할 수 있을 것이다.
○ 학습서 텍스트에 나타난 언어 특성 연구: 당시 교육 현장에서 중요하게 다루어진 어휘와 표현들이 무엇인지 확인해 봄으로써 해당 시기의 언어 사용 상황과 어휘 및 표현 선택의 변화를 탐구한다. 특히, 다양한 대화문과 회화 표현 등을 통해서는 당시의 구어 사용 양상을 엿볼 수 있게 될 것이다. 학습서에 사용된 당시 문법 체계와 문법 용어를 살펴보는 일은 한국어 문법 체계를 통시적으로 고찰하기 위한 국어사적 자료로도 활용될 수 있다.
○ 학습서 기반 문화 연구: 학습서에 담겨 있는 한국의 음식, 한국의 주거, 손님 대접, 여행하기, 경제활동 사회·정치 제도 등과 같은 서민들의 생활양식을 포함하는 일상생활 문화 및 사회·정치 문화를 분석한다. 또한 분석된 문화적 요소들을 현재 한국어 교육에 반영할 수 있는 가능성을 모색해 볼 것이다. 당시의 학습서에 나타난 문화적 요소들을 효과적으로 활용한다면, 문화 및 언어·문화 교육의 범위를 현대 문화에만 국한하지 않고 과거부터 현재에 이르는 문화 발달 과정으로 확장할 수 있을 것이다. 또한 당시의 문화와 현대 문화를 비교하여 제시함으로써 한국 문화와 언어·문화 교육에 깊이를 더할 수 있을 것이다.
○ 웹 기반 디지털 아카이브 구축: 디지털 아카이브를 구축하여 전체 자료의 메타데이터를 공개하고 저작권 및 관련 법규에 따라 공개 가능한 자료에 대해서 원문 파일을 공개하여 연구자들이 자유롭게 다운로드해 활용할 수 있도록 할 것이다. 또한 본 연구소의 검색 시스템에 학습서 자료를 탑재하여 용례 검색 및 출현 단어의 통계 분석 기능을 제공할 것이다. 원문에 대한 일반적인 검색뿐만 아니라 언어 주석 결과를 활용한 형태소 단위 검색, 옛 표기와 현재 표기를 이용한 상세 검색 또한 가능하게 될 것이다.

본 연구를 통해 한국어 교육의 역사적 자료를 보존하고, 당시 한국어 교육의 체계와 내용, 그리고 일상생활 및 사회문화를 종합적으로 분석하여, 그 결과를 디지털 아카이브로 공유함으로써 디지털 인문학 연구의 기반을 제공할 수 있을 것이라 기대한다.

키워드:

한국어 학습서, 20세기 초 한국어, 디지털 아카이브, 언어 주석, 교재 분석, 문화 연구

Korean Language Textbooks for Foreigners, Early 20th Century Korean Language, Digital Archive, Linguistic Annotation, Textbook Analysis, Cultural Study

Leave a Comment