Omnilingual ASR: 메타의 1600개 언어 지원 오픈소스 음성인식 모델

https://ai.meta.com/blog/omnilingual-asr-advancing-automatic-speech-recognition https://github.com/facebookresearch/omnilingual-asr https://aidemos.atmeta.com/omnilingualasr/language-globe 온라인 도구: https://huggingface.co/spaces/facebook/omniasr-transcriptions 논문: https://ai.meta.com/research/publications/omnilingual-asr-open-source-multilingual-speech-recognition-for-1600-languages Meta AI가 1,600개 이상의 언어를 지원하는 새로운 자동 음성 인식(ASR) 기술인 ‘옴니링구얼 ASR(Omnilingual ASR)’을 공개했습니다. 이 기술의 주요 내용은 다음과 같습니다. 핵심 기능 및 성과: 기술적 특징: 의의 및 목표:

Brain-IT:사람의 뇌파로 이미지 복원

Brain-IT: Image Reconstruction from fMRI via Brain-Interaction Transformer https://arxiv.org/abs/2510.25976 fMRI 뇌 활동 기록을 통해 사람이 본 이미지를 재구성하는 기술은 인간의 뇌를 비침습적으로 들여다볼 수 있는 창을 제공합니다. 최근 확산 모델(diffusion models)을 통해 진전이 있었음에도 불구하고, 현재의 방법들은 실제 본 이미지에 대한 충실도가 부족한 경우가 많습니다. 우리는 이러한 문제를 해결하기 위해 뇌에서 영감을 받은 접근 방식인 … 더 읽기

File Search Tool in Gemini API : 내 손안에 NotebookLM

https://blog.google/technology/developers/file-search-gemini-api 관리형 RAG 시스템: 파일 검색 도구는 Gemini API에 직접 내장된 완전 관리형 RAG(Retrieval-Augmented Generation, 검색 증강 생성) 시스템입니다. 개발 간소화: 이 도구는 RAG 파이프라인의 복잡한 과정(파일 저장, 청크화, 임베딩, 컨텍스트 주입 등)을 자동 관리하여 개발자가 더 쉽게 Gemini를 자신의 데이터와 연결할 수 있게 해줍니다. 비용 효율성: 쿼리 시점의 저장 및 임베딩 생성 비용은 무료입니다. … 더 읽기

HUSOP – 인문사회통합성과확산센터

https://www.husop.kr 인문사회통합성과확산센터는 한국연구재단에서 지원한 인문사회 분야 집단연구 사업의 연구 성과를 통합하고 체계적으로 관리하여 그것의 사회적 확산을 도모하기 위해 설립되었습니다. 인문사회의 성과들을 통합적으로 살펴볼 수 있는 곳이며, 연구소 목록을 통해서 HK+, 인문사회연구소, 융합연구에 선정된 연구소들을 살펴볼 수도 있습니다. 프로젝트 기획을 고민 중인 분들에게는 기존 연구 현황을 살펴볼 수 있는 좋은 공간입니다.

인문사회 융합인재양성사업 2025 정책포럼

교수신문. ‘인문사회+AI’로 교육 패러다임 전환…AI 사회 설계·운영 인재 키운다. 2025.11.06. 인문사회교육이 AI의 ‘핵심 재료’인 데이터를 직접 탐구·가공하는 교육으로 전환해야 한다는 주장이 나왔다. 유인태 전남대 교수(중어중문학과)는 「인문사회교육은 AI를 어떻게 만나야 하는가?: ‘데이터’, ‘경험’ 중심 인재 양성과 인문사회교육의 미래」를 발표했다. “AI의 성능과 정체성을 결정하는 가장 근본적인 재료는 데이터이다.” 유 교수는 “학문별 AI 교육은 요리에 비교된다”라며 “인문사회학은 식재료(데이터), … 더 읽기

EuroLLM: 유럽 언어 LLM

eurollm.io https://huggingface.co/blog/eurollm-team/eurollm-9b 바로: 현재 한국에서 진행중인 승자 선정형으로 진행된 것으로 보임. 승자 선정형은 정부 정보 비대칭, 시강 왜곡, 도덕적 해이 등의 분명한 문제가 있음. 그런데 한국처럼 기본적인 체급이 현실적으로 한계가 있는 상황에서는 반도체 시장 처럼 승자 선정형으로 갈 수 밖에 없는 한계도 분명히 있음…

agi의 정의는?

https://arxiv.org/abs/2510.18212 초록: 범용 인공지능(AGI)에 대한 구체적인 정의의 부재는 오늘날의 특화된 AI와 인간 수준의 인지 사이의 격차를 모호하게 만듭니다. 본 논문은 이 문제를 해결하기 위해 정량화 가능한 프레임워크를 도입하며, AGI를 고등 교육을 받은 성인의 인지적 다재다능성과 숙련도에 부합하는 것으로 정의합니다. 이를 조작화하기 위해, 본 연구는 인간 인지에 대해 경험적으로 가장 많이 검증된 모델인 카텔-혼-캐롤(Cattell-Horn-Carroll) 이론에 방법론적 … 더 읽기

Virtual Philosophers / 홍콩대

https://phil.bdsl.ai/philosopher 바로: 홍콩대학교 하비에르 차, 최동혁 선생님이 만든 동서양 철학자와의 대화 서비스. 다국어LLM 모델을 사용하여 한국어로도 질문 가능함. 구체적인 내용은 아직 설명 페이지 없어서 모름. 물어보기는…귀찮… -0-;;;

Chandra OCR

https://github.com/datalab-to/chandra 찬드라 (Chandra) 찬드라(Chandra)는 이미지와 PDF를 레이아웃 정보를 보존하면서 구조화된 HTML/Markdown/JSON으로 변환하는 매우 정확한 OCR 모델입니다. 특징