[논문] What Should Data Science Education Do with Large Language Models? / 데이터 과학 교육은 대규모 언어 모델로 무엇을 해야 합니까?

[Submitted on 6 Jul 2023 (v1), last revised 7 Jul 2023 (this version, v2)] What Should Data Science Education Do with Large Language Models? Xinming Tu, James Zou, Weijie J. Su, Linjun Zhang The rapid advances of large language models (LLMs), such as ChatGPT, are revolutionizing data science and statistics. These state-of-the-art tools can streamline complex processes. As

[논문] 한국전쟁 역사 자료에서 지식 그래프와 온톨로지를 구축하기 위한 지식 추출 및 표현 기법 / 박지연, 김홍중

RISS: https://www.riss.kr/link?id=A108945832 KCI: https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART003048775 KISS: https://kiss.kstudy.com/Detail/Ar?key=4070842 초록: 한국전쟁과 관련하여 다양한 역사 자료와 기록물이 존재하고 이러한 자료들을 효과적으로 관리하고 활용 분야를 넓히고자 하는 연구가 활발하게 진행되고 있다. 특히 고급 인공지능 기술 중 하나인 지식 그래프는 기록물을 효과적으로 관리하고 분석하기 위해 유용하게 쓰이며 활용할 수 있는 분야가 매우 넓은 기술이다. 본 논문은 딥러닝을 이용하여 한국전쟁 역사 자료에서

[논문] 사회과학에서의 데이터 혁명에는 질적 연구가 필요하다

니콜리차그리고로폴루, 마리오L.스몰, 이지원. (2024). 사회과학에서의 데이터 혁명에는 질적 연구가 필요하다. 조사연구, 25(1), 81-93. 10.20997/SR.25.1.4 인간 행동에 관한 연구에서 대용량 데이터가 갈수록 더 빈번하게 사용되고 있지만 오늘날 연구자들은 양질의 사회과학 지식을 생산하는 데 있어 대용량 데이터가 가지는 여러 한계를 인지하고 있다. 질적 연구는 이러한 문제 중 일부를 예방할 수 있다. 질적 연구는 우리가 수집한 데이터의 질을

[논문] MingOfficial: A Ming Official Career Dataset and a Historical Context-Aware Representation Learning Framework

In Chinese studies, understanding the nuanced traits of historical figures, often not explicitly evident in biographical data, has been a key interest. However, identifying these traits can be challenging due to the need for domain expertise, specialist knowledge, and context-specific insights, making the process time-consuming and difficult to scale. Our focus on studying officials from

[논문] 아동문학 연구의 지적 구조 분석(2010~2021년) -『아동청소년문학연구』와 『한국아동문학연구』의 저자 동시 인용망 분석

아동문학 연구의 지적 구조 분석(2010~2021년) -『아동청소년문학연구』와 『한국아동문학연구』의 저자 동시 인용망 분석- = Analysis of the Intellectual Structure of Children's Literature Studies (2010–2021) -Co–citation Network Analysis from Studies of Literature for Children and Young Adult & Korea Children's Literature https://www.riss.kr/link?id=A108915732 https://github.com/soohwankang/cna_childrens_literature_studies 본 논문은 현대 아동문학 연구계의 지적 구조를 분석하기 위해 저자 동시 인용망 분석을 시도한다. 분석

Digital Korean Studies in Korean Studies

하와이 대학교(University of Hawai'i)의 한국학 센터에서 출판하는 국제학술지 <Korean Studies>의 스폐셜 섹션 Digital Korean Studies (디지털 한국학)이 발간되었습니다. 홍콩대 Javier Cha 교수님과 덴마크대 Barbara Wall 교수님이 함께 좋은 연구를 모아 발간하셨습니다. "(Editor's Note) The digital transformation of Korean studies in the past two decades has reshaped all areas of research, from conceptualization to publication, a

[논문] How Male and Female Literary Authors Write About Affect Across Cultures and Over Historical Periods

1719~2020년까지 나온 2,281개의 문학 (영어) 말뭉치 데이터와 저자 성별 데이터를 토대로, 성별에 따라 감정을 인식하고, 표현하고 조절하는 방식의 차이가 있는지 분석한 논문. "A wealth of literature suggests the existence of sex differences in how emotions are experienced, recognized, expressed, and regulated. However, to what extent these differences result from the put in place of stereotypes

Reproducibility, verifiability, and computational historical research

"Digital humanities methods have been at the heart of a recent series of high-profile historical research projects. But these approaches raise new questions about reproducibility and verifiability in a field of research where grounding one's conclusions in a body of historical evidence is crucial. While there have been extensive debates about the nature and methods

[논문] Speak, Memory: An Archaeology of Books Known to ChatGPT/GPT-4

UC 버클리 정보학과의 Bamman 교수가 참여한 논문. 인공지능에게 소설 문장을 주고 주인공의 이름을 맞추는 (빈칸 뚫어 있는 것을 맞추기, fill-mask라고 불리는 task) 실험을 실시함. GPT4, ChatGPT, BERT 마다 정확도가 다른 것을 확인. 또한 유명한 소설이라고해서 정확도가 높지 않다는 것도 확인. In this work, we carry out a data archaeology to infer books that are known