조정민 / 한국외국어대학교 / 인문학 / AI 시대 아랍어 듣기 교육 도구로서 음성합성기술(TTS)의 적용 가능성 연구 / 2024년도 인문사회학술연구교수B유형 예비선정
연구목표:
1) 연구의 필요성
본 연구는 AI 시대를 맞이하여 아랍어 듣기 교육 도구로서 음성합성기술(TTS: Text to Speech)의 적용 가능성을 모색하고자 한다. 국내 아랍어 교육 환경을 살펴보면, 듣기 학습에 대한 지속적인 학습 수요가 발생하고 있음에도 불구하고 듣기 교육 및 학습을 위한 콘텐츠 부족으로 교수자와 학습자의 어려움이 가중되고 있다. 이러한 배경 하에, 본 연구는 음성합성기술의 국내 아랍어 듣기 교육 도구로서 적용 가능성을 모색한다.
‘지속적인 학습 수요’
국내 아랍어 학습자들은 학습 활동에서 ‘말하기’와 ‘듣기’에 우선 순위를 두고 있으며, 현재 수업 여건에서 ‘듣기’ 활동과 ‘의사소통 기회’가 가장 강화될 필요가 있다(공지현, 2011:67). 아랍어 학습에 있어 듣기는 예전부터 현재까지 가장 어려운 영역으로 인식되고 있으며 여전히 더 많은 학습 활동을 필요로 하는 영역이다(조정민, 2023:23). 이와 같이 듣기 학습은 아랍어 습득을 위한 중요한 전제 조건이며, 이에 대한 국내 학습자들의 학습 수요가 지속적으로 증가하고 있음을 알 수 있다.
‘제한적인 노출 기회’
‘초고난도 언어(Superhard Language)’ 에 속하는 아랍어에는 다른 언어에는 존재하지 않는 ض(다드)와 같은 알파벳이 존재하여 대학 단계에서 알파벳 학습부터 시작하는 국내 아랍어 학습자들은 아랍어를 듣고 말하는데 있어 많은 도전과제에 봉착하게 된다. 더욱이 국내 아랍어 학습 환경을 살펴보면 아랍어 원어민과 대화할 수 있는 기회는 주로 교실 환경 안에서만 이루어지기 때문에 원어에 대한 반복적인 노출과 입력 기회가 매우 제한적이다.
‘제한적인 학습 콘텐츠’
이에 대한 대안으로 원어민의 음성 파일이 제공되는 교재나 온라인 콘텐츠를 활용할 수 있다. 그러나 아랍어 교재의 경우 원어민 음성 파일이 제공되지 않거나, 주요 텍스트에 한해서만 원어민 음성 파일이 제공되는 경우가 많아 이를 듣기 교육에 활용하는데 제한이 있다. 온라인 콘텐츠의 경우 다양한 동영상과 음성 파일, 텍스트가 존재하지만, 대부분의 경우 텍스트 없이 영상이나 음성만 제공하거나 텍스트는 있지만 이에 대한 음성 파일을 제공하지 않은 경우가 일반적이다.
2) 선행 사례와의 비교 및 주제의 창의성
‘시의적 연구’
아랍어 듣기 교육에 관한 선행 연구는 일부 연구자가 중심이 되어 최근 10년 간 진행되어왔다. 주로 문항 유형, 빈칸 채우기와 오류 수정, 받아쓰기 활동 등 기존의 아랍어 학습 활동을 통한 듣기 능력 및 정의적 영역에 대한 연구와 TV광고나 애니메이션과 같은 콘텐츠를 활용한 아랍어 듣기 교육에 효과를 고찰하고 교육적 제언을 하는 방식으로 이루어졌다. 본 연구는 AI기술의 발전과 함께 외국어 교육의 패러다임이 급격한 변화를 겪고 있는 가운데 한국인 아랍어 학습자들의 듣기 교육에 음성합성기술이라는 AI 기술을 적용하여 실질적인 듣기 콘텐츠로서의 활용 가능성을 모색한다는 점에서 매우 시의적인 연구로 여겨진다.
‘다층적 연구’
기존의 아랍어 듣기 교육이나 음성합성기술을 활용한 외국어 교육 관련 연구는 교육의 수용자인 학습자 중심의 연구가 주로 이루었다. 이와 달리 본 연구는 음성합성기술을 기반으로 음성 파일을 제작한 후 본 연구자와 원어민 전문가의 분석, 교수자의 수용성, 학습자의 수용성에 대해 다층적으로 고찰한다는 점에서 기존의 연구와 차별성을 가진다.
3) 연구 목적의 타당성
기존의 아랍어 듣기 교육이나 음성합성기술을 활용한 외국어 교육 관련 선행연구를 살펴본 결과, 한국인 아랍어 학습자의 듣기 교육에 음성합성기술의 적용 가능성에 대해 다룬 연구는 국내외적으로 아직 진행된 바 없다. 이와 같이 본 연구는 국내 아랍어 듣기 교육에 음성합성기술 적용 가능성에 대해 교수자와 학습자를 중심으로 통합적으로 모색하는 국내 최초의 연구라는 점에서 연구 목적의 타당성을 찾아볼 수 있다. 이와 더불어 한국-아랍 국가들 간의 교류와 협력이 다양한 분야로 확대되고 있는 가운데 아랍어 교육, 특히 원활한 소통을 위한 듣기 교육을 위한 다층적이고 실용적인 연구가 필요한 시점이다.
기대효과:
본 연구 과제 수행 과정에서 산출될 것으로 예상되는 중간 결과물로는 음성합성기술을 활용한 아랍어 텍스트의 음성 변환 결과물이 있다. 본 연구자는 음성합성기술을 통해 제작된 음성 파일과 원어민의 음성 파일을 1차 비교·분석한 후 원어민 전문가의 자문을 통해 2차 비교·분석을 진행한다. 결과물에 나타난 발음 및 억양 오류를 유형별로 분류 및 범주화하여 아랍어를 중심으로 한 음성합성기술의 가능성과 한계를 도출해 낼 것이다. 또한 교수자와 학습자를 대상으로 음성합성기술의 듣기 교육 도구로서의 가능성을 조사하기 위해 설문조사와 인터뷰를 진행하여 교수자와 학습자의 수용성에 대한 통합적인 자료를 도출해 낼 것이다. 본 연구 결과의 기대효과 및 활용 방안은 다음과 같다.
1) 학문적 측면
- 본 연구의 결과물이 아랍어학의 실용적 연구를 위한 기초자료로 활용될 것으로 기대된다.
- 본 연구의 결과물을 기초자료로 하여 새로운 관련 후속연구들이 이어질 것으로 기대된다.
2) 교육적 측면
- 본 연구의 결과물이 한국인 아랍어 교수자 차원에서 듣기 교육의 중요성을 인지하게 하고, 듣기 교육 시 용이하게 듣기 학습 자료를 구축할 수 있는 유용한 도구가 될 것으로 기대된다.
- 본 연구의 결과물이 한국인 아랍어 학습자 차원에서 교수자가 제공한 혹은 본인 스스로 구축한 듣기 학습 자료를 통해 듣기 역량 및 의사소통능력을 향상시키는데 기여할 것으로 기대된다.
3) 사회적 측면
- 본 연구의 결과물이 아랍 국가들과의 의사소통능력을 향상시키기 위한 기초자료로 활용됨으로써 향후 한국과 아랍 국가들 간의 교류와 협력을 강화하는데 기여할 것으로 기대된다.
4) 후속연구와의 연계 활용 방안
- 본 연구의 결과물이 한국인 아랍어 교수자의 차원에서 듣기 교육을 위한 AI 기술 기반 교재 개발 연구나 교수법 연구, 한국인 아랍어 학습자의 차원에서 AI 기술을 활용한 학습자 주도의 듣기 학습 등의 후속연구로 이어질 것으로 기대된다.
연구요약:
1) 연구 대상
본 연구는 음성합성기술을 활용하여 텍스트를 음성화한 후에 연구자와 원어민 전문가의 시각으로 음성합성기술의 듣기 교육 도구로서의 가능성과 한계점을 모색하고 교수자와 학습자를 대상으로 이에 대한 수용성을 고찰하고자 한다.
먼저 연구에 활용할 텍스트 선정은 국내 대학에서 사용되는 아랍어 학습 교재 중 음성 파일이 있는 교재의 텍스트로 선정한다. 음성 파일이 있는 교재의 텍스트를 연구 대상으로 삼은 이유는 기존의 원어민 음성 파일과 음성합성기술을 활용해서 제작된 음성 파일 간의 비교·분석을 수행하기 위함이다. 연구 대상으로 삼은 교재는 ‘아랍어 중급(출판: HUINE)’으로 텍스트가 초·중급 학습자에게 유용한 표현으로 구성되어 있고, 정확한 발음과 억양으로 낭독한 원어민 음성 파일이 제공되기 때문이다.
교재의 1과, 2과, 3과 본문을 음성합성기술을 활용해 음성 변화하기 위한 도구로 다양한 음성합성기술 애플리케이션 중 Narakee를 활용한다. Narakeet를 선정한 이유로 아랍어 텍스트 음성 변환을 지원하고 있으며, 인간의 음성에 가까운 자연스럽고 다양한 음성을 지원하기 때문이다. 그리고 무엇보다 학습자들의 향후 활용 접근성을 고려하여 쉽고 편리하게 사용할 수 있다는 점이 특징이다.
교수자와 학습자의 음성합성기술 기반 음성 자료에 대한 수용성을 검증하기 위해 국내 대학에서 아랍어를 가르치고 있는 교수자 20명을 대상으로 설문조사와 인터뷰를 진행한다. 아랍어를 가르치는 국내 대학이 8개 캠퍼스임을 고려해 볼 때 20명이라는 숫자는 적지 않은 수임을 알 수 있다. 다음으로 학습자는 국내 대학에서 아랍어를 공부하고 있는 학습자(전공 무관) 100명을 대상으로 한다.
2) 연구 범위
본 연구의 범위는 음성합성기술을 통해 제작된 음성 파일과 원어민의 음성 파일을 비교·분석하여 이규철(2014)에 따라 발음 오류를 유형별로 분류 및 범주화하는 것이다. 또한 음성합성기술을 통해 제작된 음성 파일의 가능성과 한계에 대해 교수자와 학습자를 대상으로 설문조사와 인터뷰를 진행하여 듣기 교육 도구로서의 적용 가능성을 고찰하는 것이다.
3) 연구 방법
본 연구는 음성합성기술을 활용한 음성 자료 제작, 비교·분석, 설문조사 및 인터뷰를 포함하는 양적 연구와 질적 연구이다.
(1) 음성 자료 구축 및 비교·분석
본 연구자는 아랍어 중급 교재의 1~3과 본문을 Narakeet로 변환하여 음성 자료를 구축한다. 연구자가 구축된 음성 자료와 원어민 음성 파일에 대한 1차 비교·분석을 진행하고, 국내 아랍어 원어민 교수의 자문을 받아 2차 비교·분석을 진행한다. 객관적인 지표를 도출하기 위해 Sound spectrograph, Praat와 같은 음성 분석 툴도 함께 활용한다.
(2) 설문조사 및 인터뷰
한국인 아랍어 교수자 및 학습자들을 대상으로 설문조사를 시행한다. 설문조사 시에는 음성합성기술을 통해 제작된 음성 파일과 원어민 음성 파일을 첨부해서 교수자와 학습자가 이를 듣고 설문조사에 참여하도록 한다. 설문조사 도구로는 구글폼(Google form)을 활용한다. 구글폼은 무료 플랫폼이며, 음성 파일 첨부가 가능하고, 누구나 손쉽게 이용할 수 있기 때문이다. 설문조사 시행 후 일부 연구 참여자들을 대상으로 인터뷰를 진행한다. 이를 통해 음성합성기술 기반 듣기 교육 콘텐츠에 대한 교수자와 학습자의 수용성을 양적으로, 질적으로 심도 있게 고찰한다.
4) 연구 성과 확산 활동 계획
연구 성과 확산 활동의 일환으로 아랍어 교육과 관련된 학술대회에서 연구 중간 결과물을 발표하고 연구 결과를 관련 학술지에 논문화하여 발표한다. 이를 통해 국내 아랍어 교수자, 아랍어 학습자 및 아랍어 교육 분야 연구자들과 연구 성과를 공유하고 아랍어 듣기 교육의 기초자료로 활용할 수 있도록 한다.
키워드:
AI 시대, 아랍어, 듣기 교육 도구, 음성합성기술, 적용 가능성, 수용성
AI Era, Arabic Language, Listening Education Tool, TTS(Text to Speech) Technology, Applicability, Acceptability