박유빈 / 데이터 흐름 속 문학적 발견: 명말청초 전겸익의 시 창작의 혁신적 탐구 / 2024년도 인문사회학술연구교수B유형

박유빈 / 전북대학교 / 인문학 / 데이터 흐름 속 문학적 발견: 명말청초 전겸익의 시 창작의 혁신적 탐구 / 2024년도 인문사회학술연구교수B유형 예비선정

연구목표:

이 연구는 전통 인문학과 디지털 인문학의 결합을 통해 중국 고전 시문학의 새로운 연구 방향을 모색하고자 한다. 디지털 인문학은 정보통신기술을 활용하여 인문학 연구, 교육 및 창조적 저작 활동을 혁신적인 방식으로 수행하는 학문 분야로, 데이터 분석(data analysis)과 데이터 시각화(data visualization)를 주요 연구 방법으로 채택한다. 데이터 시각화는 복잡한 데이터 집합을 이해하기 쉬운 형태로 변환하는 과정을 의미하며, 차트, 그래프, 지도 등 다양한 시각적 요소를 통해 정보를 전달한다. 이러한 과정은 분석가들이 원시 데이터에서 유의미한 정보를 추출하고, 더 나은 의사 결정 및 분석 결과를 도출할 수 있도록 지원한다. 그러나 중국 고전 문학 연구 분야에서 이러한 데이터 분석 및 시각화 도구와 플랫폼의 활용도는 초기 단계에 머무르고 있으며, 관련 연구가 부족한 실정이다.
이 연구는 디지털 인문학의 방법론을 적용하여 중국 고전 시 연구에 혁신을 도모하며, NLP, THULAC, 微詞云, 타임라인 메이커 등 다양한 데이터 분석 및 시각화 도구를 데이터의 종류, 분석 목적에 따라 적합한 도구를 채택하여 활용할 계획이다. 이들 도구는 기존의 질적연구를 과학적으로 검증하고, 새로운 관점이나 특징을 발견하는데 유용하다.
이 연구는 텍스트 데이터의 형식적·내용적 특징을 분석함으로써, 중국 고전 시의 창작 과정과 내용에 대한 질적·양적 양방향 해석을 가능하게 하여 문학 연구 방법의 외연을 확장할 것이다.
문학은 텍스트 기반에서 표현되기 때문에 일반적으로 평면적인 경향을 띤다. 그러나 중국 고전 시의 창작은 작가의 개인적 특성과 작품의 형식적 요소가 상호작용하는 복합적인 과정을 거친다. 이를 객관적인 분석 지표를 바탕으로 시각화함으로써, 텍스트의 다차원적(입체적) 해석을 가능하게 하고, 대량의 시 데이터 분석을 통해 새로운 경향을 발견하여 중국 고전 시의 문화적·예술적 가치를 재조명할 것이다.
본 연구는 특히 명말 청초 시기를 대표하는 명·청 시파의 핵심역량으로 평가받았던 전겸익의 시 창작을 사례 연구의 대상으로 선정하였다. 전겸익의 시 창작은 ‘詩史’, ‘通經汲古’, ‘別裁偽體, 轉益多師’의 다양한 특징을 보여주며, 이러한 특징은 전겸익의 집대성적 성격을 반영한 결과이다. 따라서 이를 증명하기 위해 장악해야 할 대량의 문헌 데이터는 기존의 문학 연구 방법으로 접근하는 데 한계가 있다. 이에, 디지털 인문학의 방법론을 활용하여 그의 시 창작 특징과 변화를 종합적, 구체적으로 분석함으로써, 중국 고전 시문학 연구에 새로운 이해와 해석을 제공할 것이다. 이는 ‘텍스트 분석과 시각화를 통한 문학적 테마 및 모티프 분석’, ‘딥러닝 언어모델을 이용한 언어적 특성 연구’, ‘문화적 맥락과의 연계 분석’ 등을 포함한다,
○텍스트 분석과 시각화를 통한 문학적 테마 및 모티프 분석: 중국 고전 시를 대상으로, 시어와 주제, 감정 분석 등 데이터 분석 기법을 적용하여 각 특징과 추이를 탐색하고, 이를 시각화하여 시 창작의 주요 특성과 경향을 파악한다.
○딥러닝 언어모델을 이용한 언어적 특성 연구: 딥러닝 기반 언어모델을 활용하여 중국 고전 시의 언어적 특성을 분석한다. 본 연구는 중국어, 한자의 자연어처리 시스템 THULAC, CKIP-TRANSFORMERS, 微詞云등을 활용하여 데이터 분석 및 시각화를 진행한다.
○문화적 맥락과의 연계 분석: 중국 고전 시의 시대적·사회적·지리적·문화적 배경 및 관계성을 데이터 분석과 시각화 기법을 통해 재조명한다. 이 연구는 中國歷代人物傳記資料庫, 國家地球系統科學數據中心, BERT-CCPoem등을 통해 전겸익의 시 창작 특성을 분석하기 위한 다양한 각도의 비교분석 데이터를 구축한다.
이 연구는 중국 고전 문학 영역의 주제별 디지털 아카이브 구축, 연구자 간 지식공유, 후속 연구를 위한 기초데이터 구축, 교수-학습 방법 및 자료개발에 기여할 것이며, 전통 인문학과 디지털 인문학의 융합을 통해 중국 고전 문학 연구의 새로운 지평을 열어갈 것으로 기대한다.

기대효과:

○연구 결과의 학문적·사회적 기여도 및 연구 결과의 활용 방안
이 연구는 데이터 분석과 시각화를 통해 중국 고전 문학, 특히 시 창작의 특성에 대한 깊이 있는 이해와 새로운 발견의 기회를 제공하는 것을 목표로 한다. 이를 통해 중국 고전 문학 연구에 있어 전통적인 방법론과 디지털 인문학적 방법론의 융합을 모색하고, 이와 더불어 학문적, 사회적 기여도와 다양한 활용 가능성을 탐구하고자 한다. 이 연구의 기대효과 및 활용 방안은 다음과 같이 구체화할 수 있다.
첫째, 전통적인 문학 연구 방법론과 디지털 인문학적 방법론의 융합을 통해 중문학 연구의 범위를 확장할 수 있다. 중국 고전 시의 특징 분석에 있어 데이터 시각화의 원리와 기법을 적용한다면, 많은 양의 데이터에서 숨겨진 패턴과 유의미한 관계를 발견하고 해석하는 중요한 도구가 될 수 있다. 특히, 작가의 창작 특징의 고정성과 변화성을 정량적으로 분석함으로써, 작가의 창작 특징과 작품들 사이의 복잡한 관계를 명확하게 파악할 수 있다. 이는 중국 고전 문학의 전통적 연구 방법론에 새로운 시각을 제공하고, 디지털 인문학의 적용 가능성을 탐색하는 계기가 될 것이다.
둘째, 중국 고전 문학의 디지털 아카이브 구축 및 지식공유의 기반을 마련할 수 있다. 연구 결과물의 공유는 작가들과 그들의 작품들 사이의 상호작용과 연관성을 시각적으로 표현할 수 있는 장을 제공함으로써, 연구자들이 작가의 전체 창작 활동을 한눈에 파악하고, 작품 간의 내재한 연결고리를 발견하는 데 도움을 줄 수 있다. 또한 이를 통해, 특정 시대나 유파, 민족 간의 문학적 차이와 유사성을 한눈에 비교·규명할 수 있다.
셋째, 데이터 분석 및 시각화를 통한 교육적 활용 방안을 모색할 수 있다. 이를 통해 중국 고전 문학 교육에 있어 학습자의 이해도를 높이고, 교수-학습 방법의 혁신을 도모할 수 있다. 특히, 학습자에게 작가의 창작 특징과 문학적 풍격을 보다 직관적이고 이해하기 쉬운 방식으로 제시함으로써, 비교적 난도가 높은 영역에 속하는 중국 고전 문학의 학습 효율성을 제고하고 학습자의 수요에 최적화된 교수-학습 방법을 모색할 수 있다. 이를 통해 데이터 활용 범위가 넓어지고, 나아가 새로운 가치 창출의 범위가 확대될 수 있다.
넷째, 이 연구는 후속 연구와의 연계성을 고려한 기여를 할 것이다. 이 연구의 결과 발표와 공유(국내외 학술대회 참가 및 연구 성과 발표)를 통해, 연구의 신뢰성과 타당성을 높이고, 중국 고전 문학 연구의 새로운 방향을 제시할 수 있다. 이는 선행 연구의 한계를 보완하고, 문학 연구의 미래지향적인 연구모형을 모색하는 데 중요한 기반이 될 것이다.

결론적으로, 데이터 분석 및 시각화를 활용한 중국 고전 문학 연구는 학문적, 사회적 기여도가 높으며, 연구 결과의 다양한 활용 가능성을 제공한다. 이는 문학 연구의 방법론을 혁신하고, 디지털 인문학의 잠재력을 확장하는 데 기여할 것이다.

연구요약:

○연구 내용 및 연구 방법
이 연구는 중국 고전 시 창작의 복잡한 양상과 내재한 의미를 규명하는 데 중점을 두고, 데이터 분석 및 시각화 도구를 활용한 방법론적 혁신을 목표로 한다. 특히, 명말청초 시기에 활동한 전겸익의 방대한 시 작품을 중심으로, 이 시기 문학의 변화와 특성을 새롭게 조명하고자 한다. 전겸익의 시는 총 2,329수가 있으며, ≪初學集≫, ≪有學集≫, ≪投筆集≫, ≪苦海集≫등에 나누어 수록되어 있다. 그의 시는 창작 시기, 배경, 주제, 시인의 감정 등 다양한 기준에 따라 20여 종의 시집으로 분류된다. 전겸익의 작품은 그 시대의 문학적 흐름과 사상적 변화를 반영하는 중요한 자료로, 그의 시는 시대적 상황과 개인적 체험을 통해 다양한 문학적 가치와 의미를 생성해내고 있다. 이에 본 연구는 전겸익의 시 데이터를 수집하고, 이를 체계적으로 분석하여 시의 형식적, 내용적 특성을 구체적으로 규명하고자 한다.
이를 위해, 텍스트 마이닝, 네트워크 분석, 시각화 기술 등 다양한 데이터 분석 방법론을 적용할 예정이다. 텍스트 마이닝을 통해 시에서 반복되는 주제나 모티프, 언어적 특성 등을 추출하고, 네트워크 분석을 통해 시의 인물, 사건, 개념 간의 관계를 규명한다. 또한, 시각화 도구를 활용하여 분석 결과를 직관적으로 이해할 수 있도록 하며, 이를 통해 전겸익 시의 다층적 의미 구조와 문학적 가치를 새롭게 해석할 것이다.
연구의 첫 단계에서는 전겸익의 전체 시를 대상으로 원시 데이터를 수집(collecting)한다. 이 원시 데이터는 시의 창작 시기, 주제, 감정 등을 포함한 다양한 메타데이터를 포함하며, 이는 후속 분석의 기초자료로 활용될 것이다. 데이터의 수집 과정은 전겸익의 시 텍스트를 디지털 형태로 변환하고, 분석 가능한 형태로 정리하는 작업을 포함한다.
두 번째 단계에서는 수집된 원시 텍스트의 분류(clustering)를 진행한다. 이 과정에서는 원시 데이터를 시집별로 분류하고, 자연언어처리 도구를 활용해 시어의 빈도, 품사, 주제별 분류 및 품사 태깅을 실시한다. 이 연구에서는 다양한 NLP도구(THULAC, CKIP-TRANSFORMERS, 微詞云 등)를 활용하여 유의미한 데이터를 탐색하고, 이를 분석 과정에 활용할 메타데이터를 추출할 예정이다.
세 번째 단계에서는 데이터 분석(analyzing)을 진행한다. 이 과정에서는 개별 시집 및 전체 시 작품에 사용된 시어의 사용 빈도, 감정, 주제 등 관련 데이터를 분석하여, 시의 소재, 주제 경향, 감정 추이를 분석할 것이다. 이를 통해 전겸익 시의 다층적 의미 구조와 문학적 가치를 새롭게 해석하고자 한다.
네 번째 단계에서는 분석 결과를 활용(utilizing)한 시각화를 진행한다. 1차 연구분석에 따라, 이 과정에서는 ‘微詞云’, ‘타임라인 메이커’, ‘知識圖譜’등 시각화 도구를 활용하여 데이터를 직관적으로 이해할 수 있도록 할 예정이다. 분석목적, 대상에 적합한 시각화 도구를 채택하여 시어의 사용 빈도, 어휘 간 네트워크, 주제경향, 감정추이를 시각화함으로써, 창작 시기에 따른 각 시집의 소재, 주제, 감정의 추이를 구체적이고 종합적으로 비교·분석할 수 있으며, 전겸익 시 창작의 시계열 데이터 및 인물, 사회, 문학의 관계도를 시각화함으로써 작가, 작품, 유파, 시대 간 비교분석이 가능할 것이다.
이러한 방법론적 접근은 중국 고전 시 연구에 새로운 연구 동향을 제시할 뿐만 아니라, 문학 연구의 디지털 전환에 기여하는 바가 클 것으로 기대된다. 이 연구를 통해, 명말 청초 시기의 문학적 변화와 전겸익의 시 창작이 가지는 다양한 의미와 가치를 보다 깊이 있고 포괄적으로 이해할 수 있는 새로운 기회를 마련함으로써, 양적분석 결과를 활용하여 연구 주제를 검증·분석하는 것을 넘어, 전통 인문학의 질적 연구 방법과의 융합을 통해 더욱 이상적인 연구목적에 도달할 것이다.

키워드:

데이터 분석, 데이터 시각화, 감정 분석, 자연어처리, 明末淸初, 전겸익(錢謙益), 집대성

Data Analysis, Data Visualization, Sentiment Analysis, Natural Language Processing(NLP), The Late Ming and Early Qing Dynasty, Qian Qianyi, Encyclopedic Compilation

Leave a Comment