Ollama: 로컬에서 무료로 LLM 모델 사용하기
Ollama는 대규모 언어 모델(LLM)을 로컬에서 실행할 수 있도록 돕는 도구이며, 이 라이브러리는 Ollama와 함께 사용할 수 있는 다양한 모델들을 모아 놓은 저장소라고 할 수 있습니다. 쉽게 말해, Ollama는 거대한 뇌를 내 컴퓨터에서 직접 사용할 수 있게 해주는 도구이고, Ollama.com/library 는 그 뇌를 업그레이드하거나, 다른 종류의 뇌로 바꿔 끼울 수 있도록 다양한 뇌 모델들을 제공하는 곳이라고 … Read more
DeepSeek에게 묻다: AI 시대, 중국사 연구가 직면한 도전과 기회
明清史研究辑刊. DeepSeek回答:AI时代,中国史研究面临的挑战与机遇. 2025.01.30. https://www.163.com/dy/article/JN5FQJ9E05438Q4K.html AI 시대의 중국사 연구: 도전과 기회 (AI 時代의 中國史 硏究: 挑戰과 機會) 인공지능(人工知能, AI) 기술의 급속한 발전 속에서, 중국사 연구(中國史 硏究)는 독특한 도전에 직면함과 동시에 전례 없는 기회를 맞이하고 있습니다. 본 분석은 문헌 처리(文獻處理), 연구 방법(硏究方法), 학과 발전(學科發展)의 세 가지 차원에서 구체적으로 논의하고자 합니다. 1. 핵심 도전: 디지털 격차와 현지화의 어려움 … Read more
[CFP] NLP4DH 2025
The 5th International Conference on Natural Language Processing for Digital Humanities (NLP4DH 2025) will be organized together with NAACL 2025. The proceedings of the conference will be published in the ACL anthology. The conference will take place in Albuquerque, USA on May 3–4, 2025. Important dates All times are Anywhere on Earth (AoE). https://www.nlp4dh.com/nlp4dh-2025
딥시크(DeepSeek)가 그 정도인가?
https://github.com/deepseek-ai 딥시크는 중국 인공지능 스타트업에서 개발한 대규모 언어 모델(LLM)입니다. 2024년 1월 20일 공개된 딥시크는 GPT-4를 능가하는 성능과 저렴한 개발 비용으로 큰 주목을 받았습니다. 특히, 딥시크가 공개된 이후 나스닥을 비롯한 미국 증시, 그리고 AI 관련 주요 기업들의 주가가 크게 하락하며 ‘딥시크 쇼크’라는 신조어까지 등장했습니다. 딥시크 쇼크 & 나스닥 폭락 딥시크의 등장은 AI 기술 분야의 ‘스푸트니크 모멘트’로 … Read more
[논문] OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking
https://arxiv.org/abs/2501.09751 https://github.com/zjunlp/OmniThink Machine writing with large language models often relies on retrieval-augmented generation. However, these approaches remain confined within the boundaries of the model’s predefined scope, limiting the generation of content with rich information. Specifically, vanilla-retrieved information tends to lack depth, utility, and suffers from redundancy, which negatively impacts the quality of generated articles, leading … Read more
[논문] Evolving Deeper LLM Thinking
https://arxiv.org/abs/2501.09891 We explore an evolutionary search strategy for scaling inference time compute in Large Language Models. The proposed approach, Mind Evolution, uses a language model to generate, recombine and refine candidate responses. The proposed approach avoids the need to formalize the underlying inference problem whenever a solution evaluator is available. Controlling for inference cost, we … Read more
InkSight: Offline-to-Online Handwriting Conversion by Learning to Read and Write
https://github.com/google-research/inksight InkSight is an offline-to-online handwriting conversion system that transforms photos of handwritten text into digital ink through a Vision Transformer (ViT) and mT5 encoder-decoder architecture. By combining reading and writing priors in a multi-task training framework, our models process handwritten content without requiring specialized equipment, handling diverse writing styles and backgrounds. The system supports … Read more
[저서] The Chinese Computer – A Global History of the Information Age
MIT Press 서지 정보 The fascinating, untold story of how the Chinese language overcame unparalleled challenges and revolutionized the world of computing. A standard QWERTY keyboard has a few dozen keys. How can Chinese—a language with tens of thousands of characters and no alphabet—be input on such a device? In The Chinese Computer, Thomas S. Mullaney … Read more
[논문] 생성형 AI, 고등 교육의 새로운 계산기?
The New Calculator? Practices, Norms, and Implications of Generative AI in Higher Education. https://arxiv.org/abs/2501.08864 Simkute 외(2025)의 논문에서는 고등 교육에서 생성형 AI(GenAI)의 사용 현황, 규범, 그리고 그 영향에 대한 심층적인 연구를 수행했습니다. 본 연구는 2023년 12월부터 2024년 2월까지 영국 내 두 개 대학의 다양한 학과 학생 26명과 교수 11명을 대상으로 반 구조화된 인터뷰를 통해 진행되었습니다. … Read more