한국국학진흥원 OCR 프로젝트
고도서 한자 인식 고문서 한자 인식(시험판) 고도서 이미지 검색 필사본 자전 고문헌 한문 자동 문장 분절(시험판)
고도서 한자 인식 고문서 한자 인식(시험판) 고도서 이미지 검색 필사본 자전 고문헌 한문 자동 문장 분절(시험판)
https://github.com/placemark GN⁺: 웹 기반 지리 공간 데이터 편집기인 Placemark, 이제 오픈 소스로 전환 Placemark 애플리케이션 소개 초기 오픈 소스 릴리스 주의사항 기술 스택 Docker를 이용한 실행 Render에서 실행 설치 환경 변수 필수 및 선택적 환경 변수 인프라 도메인 로컬 SSL 테스트 Stripe 사용 GN⁺의 의견
Github: https://github.com/kakaobrain/honeybee 논문: Honeybee: Locality-enhanced Projector for Multimodal LLM // https://arxiv.org/abs/2312.06742 바로: 한국어를 기반으로 하는 LLM이 많다고 하기 어려운 상황에서 경량화 멀티모달 LLM을 공개한 카카오에게… 성은이 망극하나이다. 꾸벅–
유럽의 희곡(Drama) 말뭉치 DraCor 1.0 공개. DraCor (Drama Corpus Project) 는 유럽의 25개 언어로 된 희곡 말뭉치로 단순 말뭉치를 넘어 TEI-XML 태깅까지 된 양질의 데이터. 최근 API 1.0을 공개하면서 더 활용도가 증가하였음. Computaional Literary Studies(전산문학연구)에 가장 중요한 게 데이터 태깅과 구축임을 보여줌. 관련 링크 : https://weltliteratur.net/streamlining-the-dracor-api/
한국어 형태소 분석기인 바른(bareun)의 유튜브 채널 오픈. 개발자에게 직접 듣는 ‘바른’ 형태소 분석기의 구조와 이해 콘텐츠. https://www.youtube.com/@bareun-ai
Academia Sinica (대만 중앙연구원)의 CIKP LAB(CHINESE KNOWLEDGE AND INFORMATION PROCESSING)에서 제공하는 고전한문 형태소 분석/개체명인식 등 NLP 관련 툴/소스와 서비스. 아래 웹사이트에서 텍스트 입력시 트랜스포머 토크나이징과 개체명 인식 등이 가능. https://ckip.iis.sinica.edu.tw/service/transformers/ 깃허브 링크에서 예시 코드 확인 가능. https://github.com/ckiplab/ckip-transformers
한국학중앙연구원 인문정보학과 김바로 교수님과 해당 연구실 대학원생들의 공개한 <디지털인문학 시리즈>입니다. 위키독스에서 누구나 볼 수 있도록 공개했으며, 계속 수정 보완하실 예정이라고합니다. 디지털인문학 관련 각종 수업, 스터디 등에 활용하면 좋은 교재라고 생각합니다.
GPT 3.5 버전을 활용한 텍스트에서 지식 그래프 자동 추출하는 서비스. 한국어도 활용 가능. 🦜🔗 Text-to-graph extraction · Streamlit (auto-graph.streamlit.app) This playground explores the use of OpenAI functions and LangChain to build knowledge graphs from user-input text. It breaks down the user input text into knowledge graph triples of subject (primary entities or concepts in a sentence), predicate (actions or … Read more
https://mimotext.github.io/MiMoTextBase_Tutorial/ 프랑스 계몽주의 소설에 대한 wikbase를 기반으로 SPARQL로 질의를 하고, 그 결과를 다양한 방식(지도, 그래프 등)으로 시각화 할 수 있는 방법을 제시하는 서비스.
NARA.Labs 나라지식정보부설연구소 (naraai.net)에서 개발 승정원 일기 기반 한문 개체명 인식(NER) 모델 허깅페이스 링크: Nara-Lab/History_NER · Hugging Face 관련 논문 : [2306.14592] Transfer Learning across Several Centuries: Machine and Historian Integrated Method to Decipher Royal Secretary’s Diary (arxiv.org)