This was Paris in 1970

A digital humanities project with ‘5,000 color photos from “C’était Paris en 1970,” an amateur photo contest held to document Paris in 1970’ This was Paris in 1970 is a project by the MIT Digital Humanities Lab in collaboration with Catherine Clark, Associate Professor of History and French Studies at MIT and Director of MIT Digital Humanities. 류인태: … Read more

Elizabethan Coastal Surveys, 1565

Geolocated transcriptions of surveys commissioned by the English government in 1564 and 1565 to enquire into the state of the ports and landing places of England and Wales. 류인태: 고문헌 자료 대상 기초 연구로서, webGIS를 활용한 데이터 편찬 연구가 어떻게 가능한지를 보여주는 사례.

국립국어원 근현대 국어사전

2월 2일부터 국립국어원에서 ‘근현대 국어사전’ 서비스를 시범 운영하기 시작했습니다. 문세영의 조선어사전(1940)과 한글학회의 큰사전(1957)을 이용할 수 있습니다. 국립국어원은 지난 2022년 네이버와 한글학회와 협력해 디지털 자료 변환 작업을 마쳤습니다.

Placemark: 웹 기반 지리공간 데이터 편집기(오픈소스) GN⁺: 웹 기반 지리 공간 데이터 편집기인 Placemark, 이제 오픈 소스로 전환 Placemark 애플리케이션 소개 초기 오픈 소스 릴리스 주의사항 기술 스택 Docker를 이용한 실행 Render에서 실행 설치 환경 변수 필수 및 선택적 환경 변수 인프라 도메인 로컬 SSL 테스트 Stripe 사용 GN⁺의 의견

[기술] 허니비(Honeybee): 카카오 경량화 멀티모달 LLM

Github: 논문: Honeybee: Locality-enhanced Projector for Multimodal LLM // 바로: 한국어를 기반으로 하는 LLM이 많다고 하기 어려운 상황에서 경량화 멀티모달 LLM을 공개한 카카오에게… 성은이 망극하나이다. 꾸벅–

DraCor API 1.0 (유럽 희곡 말뭉치)

유럽의 희곡(Drama) 말뭉치 DraCor 1.0 공개. DraCor (Drama Corpus Project) 는 유럽의 25개 언어로 된 희곡 말뭉치로 단순 말뭉치를 넘어 TEI-XML 태깅까지 된 양질의 데이터. 최근 API 1.0을 공개하면서 더 활용도가 증가하였음. Computaional Literary Studies(전산문학연구)에 가장 중요한 게 데이터 태깅과 구축임을 보여줌. 관련 링크 :

ckip-transformers (고전 한문 NLP)

Academia Sinica (대만 중앙연구원)의 CIKP LAB(CHINESE KNOWLEDGE AND INFORMATION PROCESSING)에서 제공하는 고전한문 형태소 분석/개체명인식 등 NLP 관련 툴/소스와 서비스. 아래 웹사이트에서 텍스트 입력시 트랜스포머 토크나이징과 개체명 인식 등이 가능. 깃허브 링크에서 예시 코드 확인 가능.