https://github.com/deepseek-ai
딥시크는 중국 인공지능 스타트업에서 개발한 대규모 언어 모델(LLM)입니다. 2024년 1월 20일 공개된 딥시크는 GPT-4를 능가하는 성능과 저렴한 개발 비용으로 큰 주목을 받았습니다. 특히, 딥시크가 공개된 이후 나스닥을 비롯한 미국 증시, 그리고 AI 관련 주요 기업들의 주가가 크게 하락하며 ‘딥시크 쇼크’라는 신조어까지 등장했습니다.
딥시크 쇼크 & 나스닥 폭락
딥시크의 등장은 AI 기술 분야의 ‘스푸트니크 모멘트’로 비유되며, 미국 기술 산업에 큰 충격을 안겨주었습니다. 딥시크가 기존 AI 모델 대비 훨씬 저렴한 비용으로 개발되었다는 사실이 알려지면서, 투자자들은 미국 빅테크 기업들의 AI 관련 과잉 투자에 대한 우려를 표명했습니다. 이러한 우려는 나스닥 지수 3.07% 급락, S&P 500 지수 1.46% 하락으로 이어졌습니다.
특히, AI 칩의 선두 공급업체인 엔비디아는 하루 만에 17% 폭락하며 시가총액 5888억 달러(약 863조원)를 잃었습니다. 이는 미국 증시 역사상 단일 주식이 하루 동안 잃은 시가총액 기준 최대치입니다. 엔비디아의 폭락은 딥시크가 중국 수출용으로 성능을 낮춘 H800 칩을 사용하여 AI 모델을 훈련시켰다는 소식이 전해지면서 더욱 가속화되었습니다. 이는 엔비디아의 고성능, 고비용 전략에 제동이 걸릴 수 있음을 시사하며, 투자자들의 불안감을 증폭시켰습니다.
딥시크의 주요 특징
- 막대한 파라미터 수: 딥시크는 3671B+ 파라미터를 가지고 있어, GPT-3의 1750억 파라미터를 훨씬 뛰어넘습니다. 이는 더욱 복잡하고 정교한 작업을 수행할 수 있음을 의미합니다.
- 14.8조 토큰의 학습 데이터: 방대한 데이터 학습을 통해 뛰어난 성능을 발휘합니다.
- 빠른 추론 속도: GPT-4보다 빠른 속도로 답변을 생성합니다.
- 저렴한 비용: 오픈소스 기반으로 개발되어 사용 비용이 저렴하며, 개발 비용 또한 기존 AI 모델에 비해 훨씬 낮습니다. 딥시크의 V3 모델 개발 비용은 557만 6000달러(약 79억원)에 불과했습니다.
- 다양한 언어 지원: 한국어, 영어, 중국어 등 다양한 언어를 지원합니다.
- 온디바이스 AI: 저전력, 저비용으로 기기에서 직접 AI를 구동할 수 있도록 설계되었습니다.
- 오픈소스: 딥시크는 핵심 기술을 오픈소스로 공개하여 개발자들이 자유롭게 모델을 활용하고 개선할 수 있도록 하였습니다. 이는 AI 기술 발전과 생태계 확장에 큰 기여를 할 것으로 기대됩니다.
딥시크의 장점
- 뛰어난 성능: GPT-4를 능가하는 성능으로 다양한 작업 수행 가능
- 빠른 응답 속도: 빠른 추론 속도로 효율적인 작업 가능
- 저렴한 비용: 오픈소스 기반으로 비용 절감 가능
- 접근성: 다양한 언어 지원으로 접근성 향상
- 개인 정보 보호: 온디바이스 AI로 개인 정보 보호 강화
- 커뮤니티 기반 개발: 오픈소스를 통해 개발자 커뮤니티의 참여를 유도하여 빠른 기술 발전과 다양한 분야への応用을 가능하게 합니다. 또한, 투명성을 확보하여 모델의 안전성과 신뢰성을 높일 수 있습니다.
딥시크의 논란
- 중국 정부의 검열: 중국 정부의 검열으로 인해 특정 질문에 대한 답변이 제한될 수 있습니다.
- 역사적 사건 왜곡: 중국 정부의 입장에 따라 역사적 사건에 대한 정보가 왜곡될 수 있습니다.
- 데이터 보안 문제: 사용자 데이터 수집 및 저장에 대한 우려가 제기되고 있습니다.
- 성능 과장 논란: 일부 전문가들은 딥시크의 성능이 과장되었다는 의견을 제시하고 있습니다.
딥시크의 영향
- AI 기술 경쟁 심화: 딥시크의 등장으로 AI 기술 경쟁이 더욱 심화될 것으로 예상됩니다.
- AI 개발 비용 절감: 딥시크의 저렴한 개발 비용은 AI 개발의 진입 장벽을 낮추고, 더 많은 기업들이 AI 기술 개발에 참여할 수 있도록 할 것으로 예상됩니다.
- AI 접근성 확대: 딥시크의 온디바이스 AI 기술은 AI의 접근성을 확대하고, 다양한 분야에서 AI 기술 활용을 가능하게 할 것으로 예상됩니다.
- 오픈소스 생태계 확장: 딥시크의 오픈소스 정책은 AI 개발 커뮤니티 활성화와 기술 공유를 촉진하여 AI 기술 발전에 기여할 것으로 예상됩니다.
딥시크의 미래 전망
딥시크는 아직 개발 초기 단계이지만, 뛰어난 성능과 잠재력을 가진 AI 모델입니다. 앞으로 딥시크가 AI 기술 발전과 다양한 분야에 어떤 영향을 미칠지 기대됩니다.
- 글로벌 시장 진출: 중국 AI의 글로벌 시장 진출 가능성을 높일 것으로 예상됩니다.
- AI 경쟁 심화: 딥시크의 등장으로 AI 경쟁이 더욱 심화될 것으로 예상됩니다.
- 새로운 AI 모델 개발: 딥시크의 기술을 바탕으로 새로운 AI 모델 개발이 활발해질 것으로 예상됩니다.
딥시크는 AI 업계에 큰 파장을 일으키고 있으며, 앞으로 다양한 분야에서 활용될 것으로 예상됩니다. 특히 오픈소스를 통한 개방적인 기술 개발은 AI 생태계 확장과 기술 발전에 큰 영향을 미칠 것으로 보입니다.
바로: 딥시크로 나스닥(특히 엔비디아)가 폭락하고 난리도 아니다. 현 시점에서는 다시 회복하는 것처럼 보이지만, 아직도 난리다. 그런데 아무리 탐색하고 고민해보아도 딥시크가 이정도인가?! 라는 생각밖에 들지 않는다.
- 딥시크가 HW의 한계를 SW로 돌파한 것처럼 보이는건 대단하다. 그런데 그 발전된 SW를 한계가 없는 HW에 적용하면?!
- 딥시크가 가성비가 (부풀려져 있는 것 같지만) 좋은건 맞다. 그런데 그 보다 훨씬 더 가성비가 좋은 (덤핑으로까지 보이는) 구글의 Gemini Flash는?
- 딥시크가 “가장 최신”의 모델을 오픈소스로 공개했다는 건 분명 다양한 측면에서 긍정적이다. 근데 Meta의 LLaMA는? 그 외에 수 많은 오픈 소스 모델은?
- 딥시크는 중국 것이다. 물론 로컬에서는 정보가 전송되지 않겠지만, 웹서비스에서는 중국 정부가 내 정보를 다 볼 것이다. 물론 미국 정부도 이미 내 정보를 보고 있다. 그런데 미국이 아무리 깡패여도, 양아치만 하리라…
- 다만! 자유롭게 사용 가능한 한국어 중심의 파운데이션 모델(foundation model)이 “부족한” 한국의 입장에서 부럽긴 하다…