KADH / 한국디지털인문학협의회

This was Paris in 1970

2024-02-14 by Baro

A digital humanities project with ‘5,000 color photos from “C’était Paris en 1970,” an amateur photo contest held to document Paris in 1970’ https://paris1970.dhlab.mit.edu/ This was Paris in 1970 is a project by the MIT Digital Humanities Lab in collaboration with Catherine Clark, Associate Professor of History and French Studies at MIT and Director of MIT Digital Humanities. 류인태: … Read more

Elizabethan Coastal Surveys, 1565

2024-02-152024-02-14 by Baro

Geolocated transcriptions of surveys commissioned by the English government in 1564 and 1565 to enquire into the state of the ports and landing places of England and Wales. https://github.com/docuracy/Elizabethan_Coastal_Surveys_1565/ 류인태: 고문헌 자료 대상 기초 연구로서, webGIS를 활용한 데이터 편찬 연구가 어떻게 가능한지를 보여주는 사례.

한국사데이터베이스(한국근현대잡지자료) 스크래핑 코드

2024-02-06 by 김병준

한국사데이터베이스 – 한국근현대잡지자료(https://db.history.go.kr/item/level.do?itemId=ma) 스크래핑 파이썬 코드. Colab에서 바로 실행해볼 수 있습니다. 코드 작성자 : 김병준 https://github.com/ByungjunKim/KoreanHistoryDatabase

국립국어원 근현대 국어사전

2024-02-06 by Baro

2월 2일부터 국립국어원에서 ‘근현대 국어사전’ 서비스를 시범 운영하기 시작했습니다. 문세영의 조선어사전(1940)과 한글학회의 큰사전(1957)을 이용할 수 있습니다. 국립국어원은 지난 2022년 네이버와 한글학회와 협력해 디지털 자료 변환 작업을 마쳤습니다. https://opendict.korean.go.kr/modern/main

한국국학진흥원 OCR 프로젝트

2024-02-062024-02-06 by Baro

고도서 한자 인식 고문서 한자 인식(시험판) 고도서 이미지 검색 필사본 자전 고문헌 한문 자동 문장 분절(시험판)

Placemark: 웹 기반 지리공간 데이터 편집기(오픈소스)

2024-01-29 by Baro

https://github.com/placemark GN⁺: 웹 기반 지리 공간 데이터 편집기인 Placemark, 이제 오픈 소스로 전환 Placemark 애플리케이션 소개 초기 오픈 소스 릴리스 주의사항 기술 스택 Docker를 이용한 실행 Render에서 실행 설치 환경 변수 필수 및 선택적 환경 변수 인프라 도메인 로컬 SSL 테스트 Stripe 사용 GN⁺의 의견

[기술] 허니비(Honeybee): 카카오 경량화 멀티모달 LLM

2024-01-23 by Baro

Github: https://github.com/kakaobrain/honeybee 논문: Honeybee: Locality-enhanced Projector for Multimodal LLM // https://arxiv.org/abs/2312.06742 바로: 한국어를 기반으로 하는 LLM이 많다고 하기 어려운 상황에서 경량화 멀티모달 LLM을 공개한 카카오에게… 성은이 망극하나이다. 꾸벅–

DraCor API 1.0 (유럽 희곡 말뭉치)

2023-12-06 by 김병준

유럽의 희곡(Drama) 말뭉치 DraCor 1.0 공개. DraCor (Drama Corpus Project) 는 유럽의 25개 언어로 된 희곡 말뭉치로 단순 말뭉치를 넘어 TEI-XML 태깅까지 된 양질의 데이터. 최근 API 1.0을 공개하면서 더 활용도가 증가하였음. Computaional Literary Studies(전산문학연구)에 가장 중요한 게 데이터 태깅과 구축임을 보여줌. 관련 링크 : https://weltliteratur.net/streamlining-the-dracor-api/

바른 형태소 분석기 유튜브 채널

2023-10-24 by 김병준

한국어 형태소 분석기인 바른(bareun)의 유튜브 채널 오픈. 개발자에게 직접 듣는 ‘바른’ 형태소 분석기의 구조와 이해 콘텐츠. https://www.youtube.com/@bareun-ai

ckip-transformers (고전 한문 NLP)

2023-10-05 by 김병준

Academia Sinica (대만 중앙연구원)의 CIKP LAB(CHINESE KNOWLEDGE AND INFORMATION PROCESSING)에서 제공하는 고전한문 형태소 분석/개체명인식 등 NLP 관련 툴/소스와 서비스. 아래 웹사이트에서 텍스트 입력시 트랜스포머 토크나이징과 개체명 인식 등이 가능. https://ckip.iis.sinica.edu.tw/service/transformers/ 깃허브 링크에서 예시 코드 확인 가능. https://github.com/ckiplab/ckip-transformers