생성AI 관련 뉴스레터 및 사이트 소개

요즘AI가 프로덕트를 찾아보거나 궁금한 점이 생길 때 자주 찾아보고 도움을 받은 생성AI 관련 뉴스레터 및 사이트를 소개합니다. 급변하는 AI 트렌드를 파악하는 데 조금이나마 도움이 되셨으면 좋겠습니다. 🙂 1/ 셀렉트스타 AI NEWS & TRENDS 여러 기업, 학계에서 발표하는 논문이나 기술들을 이해하기 쉽게 분석해주는 뉴스레터. 그 외에도 최근 AI 이슈나 샘 알트만 방한 등 재밌는 이슈에 대한 … Read more

전송문 (全宋文), 전원문(全元文) 목차 파일 다운로드

CBDB의 주관 기관 중에 하나인 미국 하버드 대학에서 기계가독이 가능한 전원문(全元文: 중국 원나라 시기[1271-1368]에 쓰여진 모든 글을 모아 편집한 자료)의 목차 파일를 공개하였습니다. 또, 이전에 이미 공개가 되었지만, 이 기회에 전송문(全宋文, 중국 송나라 시기[960-1279]에 쓰여진 모든 글의 모아 편집한 자료)의 목차 파일도 다시 공지 되었습니다. 아래 링크를 통해서 접근 가능합니다 전원문: https://projects.iq.harvard.edu/cbdb/data-sets전송문: 대만 송사 연구 … Read more

한국학자료통합플랫폼 / 한국학중앙연구원

https://kdp.aks.ac.kr/ 한국학자료통합플랫폼(KDP, Korean Studies Data Platform)은 여러 기관이 제공하고 있는 한국학자료를 연계통합하여 원스톱 검색 서비스를 제공합니다. 한국학자료통합플랫폼은 2000년부터 국사편찬위원회를 중심으로 역사 연구기관 자료를 모아 통합 검색 서비스를 제공해 온 ‘한국역사정보통합시스템’을 계승·발전시키려는 취지에서 개발하였습니다. 5개년(2022~2026) 사업의 첫 단계로 기존 한국역사정보통합시스템 21개 기관 29개 연계 DB를 승계하여 검색 서비스를 고도화하는 뿐만 아니라 연계 기관과 DB를 한국학 전분야로 증편하는 작업을 진행하고 있습니다. … Read more

Kiwi + 딥러닝 언어모델

“BERT, GPT, BART와 같은 딥러닝 언어모델에서는 크기가 고정된 닫힌 어휘 집합을 사용합니다. 따라서 딥러닝 언어모델에 텍스트를 입력하려면 임의의 텍스트를 고정된 어휘 집합으로 분할하여 변환해주는 토크나이저(Tokenizer)가 필수적입니다. 한국어의 경우 오랫동안 개발되어온 형태소 분석기가 있으나, 기존의 형태소 분석기들은 분석결과를 고정된 개수의 어휘로 출력하는 기능이 없었으므로 형태소 분석기를 토크나이저로 사용할 수 없었습니다. 그래서 한국어의 특징을 고려하지 못함에도 Byte … Read more

Pandas-AI(Pandas + ChatGPT)

대표적인 파이썬 데이터 핸들링 패키지인 Pandas와 OpenAI의 ChatGPT API를 활용해 자연어기반의 데이터 핸들링이 가능한 PandasAI 패키지. 예컨대 자연어로 “A컬럼에서 가장 빈도수가 큰 항목을 뽑아줘”라고 하면 판다스 함수를 알아서 실행함. gventuri/pandas-ai: Pandas AI is a Python library that integrates generative artificial intelligence capabilities into Pandas, making dataframes conversational (github.com)

한국학자료통합플랫폼(KDP)

한국학중앙연구원의 <한국학자료통합플랫폼(Korean Studies Data Platform, KDP)> 한국사데이터베이스, 국립중앙도서관 등 여러군데 흩어져있는 한국학자료를 한번에 모아볼 수 있는 플랫폼. 한국학자료통합플랫폼 (aks.ac.kr)

[성균관대]  챗GPT 기술의 이해 워크숍 안내

공지사항 게시판읽기 ( [ 교육개발센터 ] 챗GPT 기술의 이해 워크숍 안내 ) | 챗GPT (skku.edu) 1. 목적: 인공지능 챗GPT 기술에 대한 이해 제고 2. 대상: 우리 대학 교강사 및 관심있는 구성원 3. 주제 및 강사   가. 주제: 챗GPT 기술의 이해   나. 강사: 박진영 교수(인공지능학과) 4. 일시: 2023년 4월 26일(수) 13:30~15:00. Zoom 5. 신청방법: https://forms.gle/uWZWYZqT3nxiyuvr5  ~24일(월) 오후 2시까지 … Read more

[NLP] KoCHET: A Korean Cultural Heritage corpus for Entity-related Tasks

“디지털화된 전통문화유산 문서가 급증하고 보존 및 관리의 필요성이 증가함에 따라 개체에 대한 실질적인 인식과 분류 유형화가 필수적으로 요구되고 있습니다. 이를 위해 대표적인 개체 관련 작업인 명명 개체 인식(NER), 관계 추출(RE), 개체 유형화(ET)를 위한 한국어 문화유산 말뭉치인 KoCHET을 제안합니다” https://github.com/Gyeongmin47/KoCHET-A-Korean-Cultural-Heritage-corpus-for-Entity-related-Tasks

[데이터] 콘텐츠에 활용 가능한 전통문양 4,451건 무료 개방

“문화체육관광부(이하 문체부)는 한국문화정보원(원장 홍희경, 이하 문정원)과 함께 4월 7일(금), 누구나 저작권 걱정 없이 메타버스 콘텐츠 제작에 활용할 수 있는 전통문양 3D 데이터 4,451건을 구축해 ‘문체부 메타버스 데이터랩(www.culture.go.kr/datametaverse)’과 전 세계 콘텐츠 개발자들이 사용하고 있는 3D 제작 작업도구 ‘언리얼 엔진’의 마켓플레이스(www.unrealengin.com/marketplace)에서 무료로 개방한다.” https://www.koya-culture.com/news/article.html?no=139950