이동현 / 사회과학 / 생성형AI 질적 코딩과 데이터 시각화 오픈소스를 활용한 텍스트 자료의 질적 인과관계 분석 기법 / 2024년도 인문사회학술연구교수(A유형)

이동현 / 상명대학교(천안캠퍼스) 국제문화커뮤니케이션센터 / 사회과학 / 생성형AI 질적 코딩과 데이터 시각화 오픈소스를 활용한 텍스트 자료의 질적 인과관계 분석 기법 / 2024년도 인문사회학술연구교수(A유형) 예비선정

연구목표:

최근 전 세계 사회 전반에 걸쳐 인공지능(AI) 서비스에 접근이 대중화되자, 국내 학계도 챗지피티, 제미니 같은 생성형 AI 활용에 관심이 커지고 있다. 또한, 누구나 사용할 수 있는 오픈소스 기반의 데이터 시각화 도구 역시 해외의 학술 연구자를 중심으로 쓰임이 늘고 있다. 사회과학이나 학제간 분야의 학자라면 문서형 자료의 부호화를 거쳐 분석 결과를 도식화하여 인과관계를 질적으로 설명해야 할 때가 많은데, 정작 질적 코딩이란 장시간의 비정형 작업은 물론 변인 간 인과관계를 구조적으로 시각화하는 일은 개별 연구자에게 상당한 부담이다. 이에, 본 연구는 ‘질적 인과분석 연구를 더욱 수월하게 할 질적 코딩과 도식화 방식은 없을까?’라는 연구 질문을 제기하였다. 본 연구의 목적은 생성형 AI 기술과 공개된 시각화 프로그램을 써서 정성 연구자에게 작업의 효율성, 과정의 엄격성, 분석의 투명성, 결과의 타당성을 높여 귀중한 인력, 시간, 비용을 절감케 하는 질적 연구의 방법을 개발하는 데 있다. 이에, 본 연구는 대화방식 기반의 생성형 AI가 지닌 질적 코딩 능력과 텍스트 자료의 인과관계를 시각화하는 오픈소스를 활용, 새로운 차원의 인과관계 분석 방식 발굴을 1단계로, 국내외 선행 문헌이 보인 질적 연구 결과와 비교하여 개발된 기법을 검증하고 본인의 연구로 실증하는 2단계로 행한다. 본 연구는 사회과학·학제간 학자에게 종전보다 신뢰 높고 효율성 있는 연구 방안을 제공함으로써, 질적 연구 방법 차원에서 최신의 기술 접목과 학문 발전에 기여를 목표로 한다.

기대효과:

본 연구의 기대효과는 다음과 같다. 첫째, 국내 사회과학 연구에 질적 인과관계 분석을 요하는 정성적 실증 연구의 활성화이다. 지금껏 사회과학 분야는 원인-영향-결과를 분석하는 방식에 있어 정량 자료를 통한 회귀분석 등 계량적 방식을 택했기 때문이다. 둘째, 최신의 공개 기술을 활용하여 질적 코딩, 원자료 분석과 정보의 맵핑 방법의 발굴에 따른 정성 연구 방법과 지식의 경계 확장이다. 셋째, 복잡한 텍스트 구조를 가진 개인 차원의 질적 연구 진행에 있어 소중한 자원의 효율적인 투입과 체계화된 운용이다. 넷째, 빠르게 발전하는 생성형 AI의 질적 부호화 기술, AI와 호환성 높은 연구용 오픈소스의 접목에 관심 있을 사회과학·융복합 신흥 학자에게 연구 기회의 도모이다. 본 연구자는 이 같은 기대효과가 학계에서 환류되고 성과로 발현되도록 ‘생성형 AI를 이용하는 질적 코딩’, ‘오픈소스에 의한 질적 인과관계의 시각화’ 강좌를 유관 학회와 진행하고, ‘신나는 질적 연구를 위한 매뉴얼’을 생산, 소속 대학에서 대면 강의 및 온라인 개방 교육으로 전파할 것이다.

연구요약:

[연구 목적] 본 연구는 우리 연구자 주변에 접근이 손쉬운 공개용 IT 환경인 인공지능 기술(생성형 AI)과 학술용 프로그램(데이터 시각화)을 활용, 국내 사회과학 분야의 질적 인과관계 연구 전반에 걸쳐 단계별 코딩 과정의 엄격성, 투명성, 효율성과 분석 결과의 신뢰성, 타당성을 제고하면서 질적 연구자가 순환적으로 투입하는 인력, 시간, 비용을 절감하는 연구 방식의 개발과 발굴된 기법의 검증에 있다.

[연구 배경] 우리가 사회 현상의 인과를 밝혀야 하는 연구 문제에 있어, 국내 학계는 실증주의 차원에서 변수 간 원인-결과를 회귀 분석하는 계량 방식을 극히 선호한다. 하지만 후기실증주의 관점을 가진 질적 연구자는 원인-영향-결말로 얽힌 변인 간 비선형 패턴을 보면서 인과 사슬에 따라 사건을 설명/해석하는 질적 인과관계 분석에 의할 필요가 있다. 하지만, 질적 연구자에게 인과관계 자료의 부호화 과정은 부담이 상당한 과업이며, 특히 유료의 질적 코딩 소프트웨어와 호환성이 제한된 인과관계 도식화 프로그램은 경제적, 기술적으로 큰 장벽이었다.

[연구 내용] 이에, 본 연구는 국내외에 공개된 대형언어모델 기반 생성형 AI인 챗지피티, 제미니의 질적 코딩 역량과 비선형 인과 사슬을 지원하는 오픈소스인 R 패키지, 비주얼 패러다임을 활용, 문서형 자료의 질적 인과관계 분석을 위한 기법의 개발과 검증을 1단계로, 본 연구자가 직접 현장 연구를 통해 발굴된 기법을 실증하고 미래에 더욱 진화될 AI 기술을 질적 연구에 활용할 방향을 2단계 과업으로 진행한다.

[연구 방법] 본 과제는 연구 목적, 연구 내용에 맞춰 1단계(2년)에 예비적 고찰 연구(다성적 방식)에 이어 질적 연구 권위자의 선행 문헌 내 텍스트 자료 및 분석 결과와 비교하는 확인적 연구를 수행한다. 후속의 2단계(3년)는 본 연구자가 취득할 2차 자료(비구조화 문건)와 1차 자료(반구조화 인터뷰)를 통해 앞서 발굴된 연구 기법에 따라 복수의 실증 연구를 한 후, 기존 연구를 종합 검토하는 서술형 연구로 마감한다.

[의의/중요성] 본 연구는 질적 인과분석으로 복잡한 현상을 설명·해석하려는 질적 학자에게 연구의 기회와 질적 연구 방법의 선택을 넓혀주는 의의와 함께, 국내 사회분야 학계에서 첫 시도되는 생성형 AI에 의한 질적 코딩의 활용 및 AI 간 데이터 연동이 용이한 오픈소스 시각화 기술을 접목시킨 질적 연구 기법의 발굴이라는 중요성을 띤다.

키워드:

정성적 연구, 생성형 AI, 데이터 시각화, 질적 인과분석, 텍스트 자료

Qualitative research, Generative artificial intelligence, Open-source for data visualization, Qualitative causal analysis, Textual narratives

Leave a Comment