곽새라 / 한국외국어대학교 / 인문학 / 페르시아어의 차용 양상 분석과 교육적 활용: 디지털 인문학 방법론 접근 / 2024년도 공동연구지원사업 예비선정
연구목표:
본 연구는 페르시아어 어원의 어휘들이 페르시아어 사용 국가(이란, 아프가니스탄, 타지키스탄)와 이 언어의 영향을 받아 페르시아어 어휘를 외래어로 받아들여 사용하고 있는 언어권(인도-파키스탄, 튀르키예)에서 사용되고 있는 양상을 비교 분석하여 어휘적 차원에서 페르시아어의 사용 양상에 대한 언어지도를 그리는 것을 목표로 한다. 다시 말해서, 발음, 형태, 품사, 의미 등 다양한 층위에서 페르시아어 어휘가 시간의 흐름과 장소의 변화에 따라 어떠한 변화를 겪었는지 통시적·공시적으로 분석하기로 하며, 각 국가에서 해당 어휘 사용과 관련한 인식과 언어 정체성에 대해서도 분석한다. 분석 과정에서 기존의 파편적 연구 방법과 다르게 언어별 코퍼스를 구축하고, 순수 페르시아어 어원의 어휘들과 그 용례를 추출하여 연구자료의 객관성 및 다양성 그리고 분석에 대한 신뢰성을 확보하고자 한다.
언어는 끊임없이 변화한다. 페르시아어 어휘들은 역사의 흐름 속에서 새롭게 생성 및 소멸하기도 하고, 다른 문화권, 다른 언어권과의 상호 영향을 통해 진화 및 발전해 나가고 있다. 페르시아어와 다른 언어 간 영향 관계의 원인은 지역 인접성, 민족 이동, 정복, 문화 접촉, 새로운 문물과 사상의 도입 등 역사의 흐름 속에서 다양하게 찾아볼 수 있다. 현대 이란의 기원이 되는 페르시아는 그 최대 영토가 북아프리카에서 인도에 이르렀으며, 인류 최초로 최대의 영역을 통치했던 제국으로 평가된다. 7세기 아랍-이슬람의 영향으로 언어, 문화, 종교 등 다양한 방면에서 변화를 겪었지만, 과거부터 지금까지 페르시아의 언어와 문화는 주변 국가에 많은 영향을 주고 있다. 대표적인 언어가 페르시아어와 같은 어족(인도유럽어족-인도이란어군)에 속해있는 힌디어와 우르두어이다. 이 두 언어에 페르시아어의 영향이 미친 것은 페르시아 동쪽의 무갈(Mughal)제국의 영향으로써 당시 무갈제국에서는 페르시아어를 궁중어, 문화어, 지배층의 언어로 사용하였다. 그 당시에 차용한 어휘들은 지금까지도 힌디어와 우르두어에 그대로 사용되고 있다. 어족이 동일하지는 않지만, 페르시아의 서쪽 아나톨리아 반도에서도 페르시아어는 셀주크 튀르크어, 오스만 튀르크어(이하 오스만어)에 큰 영향을 미치며 궁중어인 동시에 문학어로서 널리 사용되었다. 현재 순수 페르시아어뿐 아니라, 페르시아어와 터키어가 합성어 구조를 이루고 있는 어휘들이 현대 터키어에 많은 비중을 차지하며 사용되고 있다.
페르시아, 즉 이란의 동-서에 위치하고 있는 언어권의 언어들에 페르시아어 어휘들이 큰 비중을 차지하고 사용되고 있지만, 이 어휘들은 실제 페르시아어의 발음, 용법, 의미에서는 차이가 있다. 다시 말해서, 이란에서의 해당 어휘 사용은 발음과 문자뿐만 아니라 품사, 뜻, 고정표현 등에 있어서 힌디어/우르두어 및 터키어와 다르다. 따라서 본 연구에서는 이러한 어휘 사용에 대한 차이를, 코퍼스를 활용하여 분석하고자 한다. 어휘 간의 이러한 차이가 차용 시점부터 존재했던 것인지, 시간이 흐름에 따라 변화한 것인지 분석하기 위해서는 통시적 연구는 물론 공시적인 연구가 수반되어야 한다. 본 연구에서는 역사적 문헌의 검토뿐 아니라, 각 언어별 코퍼스를 활용하여 페르시아어 어원 어휘들을 중심으로 언어의 영향 관계 및 변화를 체계적으로 분석 및 정리하고자 한다.
기대효과:
본 연구는 페르시아어 어휘를 중심으로, 이 어휘들이 힌디-우르두어, 터키어에 차용되어 사용되는 특징을 통시적, 공시적으로 파악하여 데이터화하는 것으로 기존에 국내외를 막론하고 연구된 바가 없는 창의적인 연구이다. 이 연구의 결과물은 다음과 같이 학문적으로 기여할 수 있으며 교육적으로 활용될 수 있다.
- 학문적 기여
첫째, 페르시아어, 힌디-우르두어, 터키어 전문가와 전산언어학 전문가의 총 4명의 전문가의 협업으로 진행되는 연구로, 언어학의 지평을 넓히는 동시에 향후 학제적 연구의 바람직한 표본을 만드는 계기가 될 것이다.
둘째, 페르시아어 어휘가 과거 페르시아 문화의 영향을 받은 언어들에 미친 영향을 광범위한 지역 언어들의 통시적-공시적 차원의 분석을 통해 분석함으로써 역사비교언어학 및 언어유형론 및 대조언어학 분야 발전에 기여할 수 있다.
셋째, 일명 특수외국어로 분류되는 외국어들의 디지털 인문학적 기반을 구축할 수 있다. 본 연구의 언어 자료들은 각 언어들의 코퍼스를 통해 최대한 많은 양의 데이터를 비교 분석할 예정이며, 특히, 페르시아어 어원의 어휘들을 서로 비교 및 대조할 수 있는 본 연구진만의 코퍼스를 재구축할 예정으로, 이는 기존 특수외국어 연구에서 시도되지 않았던 것으로 나날이 디지털화되는 언어 연구를 특수외국어에도 적용할 수 있다는 데에 큰 의의가 있다. - 인력 양성 및 교육적 기여
첫째, 특수외국어 분야 학문후속세대 양성에 이바지할 수 있다. 페르시아어, 힌디-우르두, 튀르키예의 언어 연구는 전문인력이 부족한 분야로서 이 연구에 참여하는 연구보조원은 자료 수집 및 정리뿐만 아니라 연구원들과 함께 실질적으로 연구에 참여하며 파생된 연구주제를 가지고 연구기간 동안 1회 이상 학술대회에서 논문을 발표도록 장려하고 지도하여, 각 분야의 학문 후속세대 양성의 기반을 마련하고자 한다.
둘째, 본 연구를 통해 구축한 데이터는 대량의 데이터에서 추출한 각 어휘들의 문맥 내 활용법, 공기어 관계, 연어 관계 등이 연구 내용에 포함되어 있어 해당 언어를 학습하려는 학습자들에게 좋은 교육 자료가 될 것이며, 대학원 등에서의 심화 교과목 개설 등에도 활용될 것이다.
셋째, 본 연구의 대상인 이란, 인도-파키스탄, 튀르키예는 우리나라의 국가전략지역으로 관련 정보 및 지식 요구가 최근 늘어나고 있으나, 관련된 국내 전문가가 부족하다. 그러나 본 연구가 진행되는 동안 수집‧정리된 자료와 연구 결과로 발표된 논문들은 다른 지역 및 권역에 대한 새로운 연구 아젠다를 창출하는데 기여할 수 있을 뿐만 아니라 이 권역에 대한 이해를 돕는 양질의 정보를 제공하여, 사회적 그리고 국가적 기여를 할 수 있다.
연구요약:
본 연구는 페르시아어 기원의 어휘들이 페르시아어 영향권의 다양한 지역에서 확대 및 변화된 추이를 코퍼스를 활용한 통시적-공시적 분석을 통해 분석하고 이를 데이터화하는 것과 이 데이터를 교육에 활용하는 것을 큰 틀로 하고 있다. 3년차로 진행될 본 연구의 연차별 연구 내용은 다음과 같다.
1) 1차년도 : 페르시아어 기원 어휘 데이터 추출
1차년도에는 본 연구에서 대상으로 삼은 언어들(페르시아어, 힌디어, 우르두어, 터키어)에서 페르시아어 기원의 어휘 대응표 1,000개 내외를 기준으로 데이터베이스 테이블을 구성하며 대응 데이터의 형태음소 대응관계를 활용한 대응 테이블을 생성한다. 본 연구에서는 대응 관계를 계산하는 알고리듬과 분절음의 대립 가치(oppositional value) 등을 수치화하는 연구를 함께 수행하여 페르시아어 공통 어휘들이 분석 대상 언어에서 얼마나 변화되었는지를 계량화한다. 계량화 방법은 인문학 자료의 거리 측정 방법 중 편집 거리 측정과 분절음의 거리 측정 방법을 활용한다.
2) 2차년도 내용 : 표준화된 페르시아어 어휘 코퍼스 구축 및 언어별 어휘 분석
기계학습, 디지털 인문학 등의 방법론을 적용하기 위해서는 표준화된 코퍼스의 구축이 필수적이다. 페르시아어, 터키어, 우르두어 등의 코퍼스를 활용하려면, 문자, 관리, 검색 방법 등을 고려하여서 원시말뭉치(raw corpus), 주석말뭉치(annotated corpus) 등을 구축하여야 하며 본 연구에서 구축하고 통합하는 코퍼스를 위한 통합 구조를 만들 필요가 있다. 2차년도에는 대상 언어 코퍼스의 수집을 하고 통합된 형식으로 활용을 할 수 있도록 하며 1차년도에서 구축한 어휘의 용례 분석을 위한 문장 자료 수집도 함께 한다. 문장 자료는 어휘의 분포 의미 조사를 위한 자료로 활용되며, 페르시아계 어휘들의 대상 언어별 사용 양상을 연구하는 기초자료로 활용한다.
3) 3차년도 내용 : 어휘와 문장, 설문 공동 분석 및 교육 자료 구축
3차년도에는 자료에 기반하여 페르시아어 기원 어휘들의 사용 양상과 언어, 문화 교육 활용 방안을 연구한다. 페르시아어 기원 어휘들이 각 언어에서 어떤 분포로 사용되는지에 대한 연구는 공기어(co-occurring words) 분석, 어휘 분포(word distribution) 조사 등을 기본 연구 방향으로 정하고 어휘 결합 관계 분석에서는 엔트로피(entropy), PPMI (Positive Pointwise Mutual Information) 등의 방법을 활용하도록 한다. 분포주의에 입각하여 유의미한 결합 관계를 추출하고, 이를 바탕으로 고정표현(fixed expression), 연어(collocation) 등의 기초 자료를 추출한다.
본 연구를 통해서 수집하고 통합하여 구축하는 자료와 이를 바탕으로 한 계산, 분석 등으로 생성된 자료는 전략 외국어인 특수어 교육에 활용할 수 있는 방법을 모색하며, 또한 해당 언어와 문화의 이해를 높일 수 있는 자료로 활용하도록 한다. 또한 언어 사용 현황을 제대로 이해하고 페르시아어 어휘 사용의 공통점과 차이점을 분석하기 위해서는 언어유형론적 분석에 입각하여, 모어의 문법 및 어휘 영향도 함께 변수로 고려하며 분석한다. 이와 더불어 언어 사용자의 해당 어휘에 대한 인식 즉, 기존 모어에 존재하는 유사 어휘와의 관계 등을 확인하기 설문조사도 병행하며, SPSS를 통해 분석하고 그들의 언어 사용 실태에 관한 연구도 함께 진행하기로 한다.
본 연구를 통해서 수집하고 통합하여 구축하는 자료와 이를 바탕으로 한 계산, 분석 등으로 생성된 자료는 전략 외국어인 특수어 교육에 활용할 수 있는 방법을 모색하며, 또한 해당 언어와 문화의 이해를 높일 수 있는 자료로 활용하도록 한다.
키워드:
페르시아어, 힌디어, 우르두어, 터키어, 코퍼스, 디지털 인문학, 통시적, 공시적, 대립 가치, 공기어, 어휘분포, 고정표현, 연어, 언어유형론
Persian, Hindi, Urdu, Turkish, corpus, digital humanities, diachronic, synchronic, opposition value, co-occurring words, word distribution, fixed expression, collocation, language typology