구영은 / 인문학 / 머신러닝과 안구운동추적기법을 활용한 독일어 대화 자동요약 모델 개발 및 활용 / 2024년도 인문사회학술연구교수(A유형)

구영은 / 성균관대학교 / 인문학 / 머신러닝과 안구운동추적기법을 활용한 독일어 대화 자동요약 모델 개발 및 활용 / 2024년도 인문사회학술연구교수(A유형) 예비선정

연구목표:

(1) 대화의 언어학적 특성을 반영한 머신러닝 기반의 독일어 대화 자동요약 모델을 개발함
(2) 대화요약을 위한 대화 내 핵심 정보 추출, 요약문 생성 등을 기존의 언어학적 이론을 토대로 분석하고, 자동화 방법론을 제시함
(3) 안구운동추적 실험을 통해 연구에서 개발한 대화 자동요약 모델의 타당성을 검증함
(4) 개발한 대화 자동요약 모델을 기반으로 독일어 L2 학습자의 대화능력을 교육 및 자동평가하는 모델을 구축함으로써 본 연구의 다양한 활용 가능성을 확인 및 제안함
(5) 전산언어학적 도구를 이용하여 모델을 구현하고, 심리언어학적 실험을 통해 타당성을 검증함으로써 융복합적 언어처리 연구의 활성화에 기여함

기대효과:

(1) 학문적 기여 및 사회적 활용 측면

  • 인간의 대화 이해 및 요약 매커니즘을 이론화
  • 대화요약을 머신러닝과 딥러닝 방법론을 이용하여 자동화 모델로 구현
  • 안구운동추적 실험을 통해 대화 자동요약 모델에 경험적 근거를 제공
  • 대화 이해 및 언어 처리에 대한 융복합적 연구의 활성화에 기여
  • 다양한 요약 서비스, 챗봇, 인공지능을 활용한 언어 교육, 언어능력 자동채점 모델 등에 활용

(2) 인력 양성 및 교육과의 연계 측면

  • 머신러닝, 안구운동추적기법 등의 융합언어학적 연구 방법론을 소개하여 학문후속세대의 학문적 성장에 기여
  • 파이썬 코딩을 이용한 데이터 크롤링, 전처리, 주석 레이블링 등의 지식을 제공하여 학부 학생들의 취업 경쟁력 제고에 기여

연구요약:

  • 본 연구는 1~2차년도에 걸처 우선적으로 독일어 대화 데이터를 수집하고 이를 다양한 층위에서 언어학적으로 심층 분석한다. 이후 3~4차년도 연구를 통해 전산언어학적 방법론을 통해 대화 자동요약 모델을 구현하고, 심리언어학적 실험을 통해 모델을 검증 및 최적화한다. 5차년도에는 개발한 대화 자동요약 모델의 다양한 활용가능성을 독일어 L2 학습자를 대상으로 한 실험을 통해 검토하고자 한다.

◾ [1차년도 – 대화요약을 위한 독일어 대화 데이터 수집]

  • 다양한 대화 데이터를 데이터 크롤링 기법을 이용하여 자동 수집하고, 파이썬 기반의 언어처리 툴킷을 이용하여 전처리 작업을 진행한다.

◾ [2차년도 – 독일어 대화의 유형별 언어학적 특징 분석 및 요약 방법론 정립]

  • 대화요약을 위해서는 대화에 대한 충분한 이해가 필수적이다. 본 연구에서는 최적의 대화 자동요약 모델 구현을 위해 대화의 특징을 다각도에서 살펴본다. 텍스트와 달리 대화가 갖는 특징들을 비롯하여, 대화의 언어, 도메인, 참여자 수 등에 따른 특성을 심층적으로 분석한다. 특히 대화의 대표적인 분석 단위인 화행을 기반으로 대화의 흐름 및 의사소통 양상을 분석한다. 이를 통해 대화 유형에 최적화된 요약 방법론을 제안하는 것을 목표한다..

◾ [3, 4차년도 – 대화 자동요약 모델 개발 및 전산/심리언어학적 실험 수행]

  • 대화 요약을 위한 언어학적 특징을 분류 자질로 활용하는 머신러닝 기반의 대화 자동요약 모델을 구현하고, 자질의 영향력을 평가하여 발화의 어떤 언어학적 특징이 대화 내 핵심 정보 추출에 효과적인지 확인한다. 뿐만 아니라 대화요약 과정에서의 안구운동을 추적하여 언어사용자가 대화를 이해하고 요약할 때 어떤 발화나 표현에 집중하는지 확인한다. 이와 같은 전산 및 심리언어학적 실험을 통해, 인간의 대화 요약 매커니즘을 실증적으로 분석하고자 한다.

◾ [5차년도 – 대화 자동요약 모델의 활용가능성 검토]

  • 본 연구를 통해 개발한 독일어 대화 자동요약 모델의 활용가능성을 검토한다. 먼저 인공지능을 활용한 외국어 교육의 측면에서, 머신러닝 기반의 대화 자동요약 모델을 활용하여 독일어 L2 학습자의 대화 이해 및 요약 능력을 교육하는 방안의 가능성을 타진한다. 뿐만 아니라 주어진 대화에 대해 학습자가 작성한 요약문과 머신러닝 모델이 자동생성한 요약문의 일치도를 자동 채점하여, 외국어 학습자의 대화 능력을 자동평가하는 방법론을 실험해본다.
  • 이를 토대로 국내 학술지 3편, 국제 (S)SCI 학술지 3편을 게재하고 관련 성과를 국내외 학술대회 발표를 통해 확산시키는 것을 목표로 함.

키워드:

대화 요약, 의사소통, 머신러닝, 딥러닝, 안구운동추적기법, 전산언어학, 심리언어학, 언어 교육, 언어능력 평가, 자동 채점

Dialogue Summarization, Communication, Machine Learning, Deep Learning, Eye-tracking, Computational linguistics, Psycholinguistics, Language education, Language skills evaluation, Automatic Scoring

Leave a Comment