고적자동정리플랫폼 – 吾与点古籍自动整理平台

http://wyd.pkudh.xyz/ 북경대학교 디지털인문학센터(北京大学数字人文研究中心)에서 만든 고적 자동 정리 플랫폼(古籍自动整理平台) 하루 사용량 제한와 글자수 제한이 존재하지만, 테스트 결과 양호한 결과를 얻었음. 특히 따로 학습을 하지 않았을 것으로 생각되는 한국식 한문에도 나름 괜찮은 결과였던 것이 인상적임. + 테스트 01 – 조선왕조실록 원문출처: https://sillok.history.go.kr/id/kea_10009013_002 원문: ○平安道助戰節制使康純辭, 上引見。 純啓曰: “本道受敵初面, 且軍人鮮少, 氷合之時, 尤爲可慮, 本道子弟, 宿衛於京者, 竝令入送防戍何如?” 上曰: “予意亦然。 凡防禦之備, 鍊軍之事, … Read more

kiwi 형태소 분석기(0.15.0 업데이트)

한국어 형태소 분석기 kiwi 업데이트. 주목할 만한 기능은 Subword Tokenizer. 서브워드는 기존 사전기반 형태소 분석이 아니라, 모델이 자주 같이 나오는 음절(혹은 다른 단위)을 단어로 인식해 묶는 방식. BERT, GPT 등 딥러닝 기반 자연어처리 모델에서는 서브워드 토크나이저를 사용 중. 기능 추가/개선 https://github.com/bab2min/Kiwi/releases/tag/v0.15.0

BIGKINDS-LAB API

데이터 분석가와 개발자를 위한 오픈소스 플랫폼으로 뉴스데이터와 타 분야 데이터를 융합할 수 있는 분석 및 개발 환경을 제공합니다. https://github.com/KPF-bigkinds/BIGKINDS-LAB

고성능컴퓨팅지원 사업(AI반도체 트랙)

디지털인문학 연구에는 좋은 서버 컴퓨터가 있으면 매우 효율적입니다. 특히 GPU와 대용량 메모리가 중요한데, NIPA에서 무료 서버를 대여해주는 사업을 몇년전부터 계속 하고 있습니다. 대학(원)의 경우 재직증명서가 있으면 신청가능합니다 (학생은 교수 재직증명서 함께 제출) https://www.nipa.kr/home/2-2/12380

Prismatic Jane Eyre

Charlotte Brontë의 『Jane Eyre』는 영어로만 존재하지 않는다. 수백 명의 번역가에 의해 60개 이상의 언어로 번역되었다. 번역가는 다른 관점에서 소설을 보기에, 새로운 언어는 새로운 표현 형식을 만든다. 『Jane Eyre』라는 소설이 전세계의 여러 언어로 번역되어 확산함에 따라 발생하는 다채로운 현상이 우리에게 던져주는 의미는 무엇인가. 국가별 다양한 간본의 『Jane Eyre』 출판사 위치와 출판본 표지를 함께 볼 수 있는 … Read more

The Arabic and Latin Glossary and Corpus

Julius-Maximilians Universität Würzburg(독일)의 Dag Nikolaus Hasse 교수와 그의 팀은 2005년부터 진행되어 온 “아랍어 및 라틴어 용어집(Arabic and Latin Glossary, ALGloss)” 편찬 연구와 2016년부터 진행되어 온 “아랍어 및 라틴어 코퍼스(Arabic and Latin Corpus, ALCorpus)” 구축 연구를 통해 중세 철학 분야의 기초 연구로서 디지털 인문학 발전에 기여하였다. ALGloss는 아랍어로 글을 쓴 중세 작가와 중세 라틴어 번역가의 어휘를 … Read more