티스토리 뷰

목차


    이것은 예상 밖이었습니다. 마이크로소프트가 오픈AI의 최대 투자자이면서 중국의 딥시크 모델을 기업용 서비스에 도입하겠다고 나선 것입니다. 미국 기업이 아닌 중국 AI를 자사 클라우드에 넣겠다는 발표를 듣고, 처음에는 많이 놀랐습니다. 비용이라는 현실이 진영 논리보다 훨씬 강하다는 것을 다시 한번 확인하게 됐습니다.

     

    MS가 딥시크 선택 (비용구조, 보안리스크, K-AI)
    MS가 딥시크 선택 (비용구조, 보안리스크, K-AI)

    MS가 딥시크 선택, 비용구조

    저는 처음에는 이 뉴스가 단순한 비용 절감 차원이라고 봤습니다. 그런데 들여다볼수록 구조적인 문제가 맞닿아 있었습니다. 마이크로소프트는 2025년 6월 16일, 기업용 AI 비서 서비스인 코파일럿 코워크에 딥시크의 최신 모델 V4 도입을 검토하겠다고 발표했습니다. 동시에 요금제도 정액제에서 종량제로 전환한다고 했는데, 이 두 가지가 묶여 있다는 점이 핵심입니다. AI 에이전트(agent)란 단순히 질문에 답하는 수준을 넘어 스스로 작업을 계획하고 반복 실행하는 자동화 시스템을 말합니다. 문제는 이 에이전트를 실제로 사용하다 보면 한 번 쓰고 끝나는 게 아니라, 같은 작업을 수백 번 반복하면서 비용이 기하급수적으로 늘어난다는 점입니다. 여기서 딥시크 V4의 구조가 주목을 받습니다. 이 모델은 MoE(Mixture of Experts) 방식을 씁니다. MoE란 1조 6,000억 개에 달하는 파라미터 전체를 한꺼번에 가동하는 게 아니라, 질문의 성격에 맞는 전문 모듈만 선택적으로 활성화해서 연산량을 대폭 줄이는 구조입니다. 이 방식 자체는 구글 등 다른 기업들도 쓰고 있지만, 딥시크는 여기에 화웨이의 어센드 칩 최적화를 결합해 비용 효율을 한층 더 끌어올렸습니다. 어센드 칩이란 미국 엔비디아의 GPU를 대체하기 위해 화웨이가 독자 개발한 AI 연산용 반도체입니다. 딥시크 V4는 처음 설계 단계부터 이 칩에 맞게 최적화됐고, 엔비디아 환경에서도 돌아가도록 이중으로 구성됐습니다. 그 결과 가격이 미국 주요 모델 대비 10분의 1 수준까지 내려갔습니다. 마이크로소프트가 내세우는 방향은 이른바 '스위치보드' 전략, 즉 하나의 모델에 종속되지 않고 여러 모델을 용도에 따라 골라 쓰는 구조입니다. 사티아 나델라 CEO가 직접 "생태계 없는 프런티어는 불안정하다"라고 언급한 것도 이 맥락입니다.

    보안 리스크, 딥시크 데이터

    일반적으로 오픈 소스 AI는 그냥 마음 놓고 써도 된다고 알려져 있지만, 딥시크는 출처가 중국이라는 점에서 생각해 봐야 합니다. 중국은 2017년에 국가정보법을 제정했습니다. 이 법은 중국 기업이 국가 안보를 위해 정부가 요청할 경우 보유한 데이터를 제공해야 한다는 의무를 규정하고 있습니다. 따라서 딥시크 공식 사이트나 중국 서버와 직접 연결된 API를 통해 질문을 입력하면, 해당 데이터가 중국 서버를 거쳐 저장될 수 있습니다. 개인정보보호위원회도 딥시크가 한국 이용자 100만 건 이상의 정보를 동의 없이 중국으로 전송한 사실을 지적한 바 있습니다(출처: 개인정보보호위원회). 마이크로소프트가 제시하는 해법이 바로 오픈 웨이트(open weight) 방식입니다. 오픈 웨이트란 모델의 학습 결과물인 가중치 파일 자체를 공개해 누구나 내려받아 자체 서버에서 구동할 수 있는 형태를 말합니다. 이렇게 하면 데이터가 중국 서버로 나갈 일이 없습니다. 퍼플렉시티 같은 미국 기업도 이미 이 방식으로 딥시크를 활용하고 있습니다. 다만 이렇게 해도 남는 문제가 있습니다.

     

    • 모델 내부에 삽입된 정치적 편향이나 검열 로직은 제거가 쉽지 않습니다. 특정 질문에 대한 답변 거부나 왜곡된 정보 제공이 나타날 수 있습니다.
    • 딥시크 모델이 화웨이 칩과 소프트웨어 생태계에 최적화돼 있어, 업데이트를 따라가다 보면 중국 하드웨어 의존도가 높아지는 락인(lock-in) 현상이 생길 수 있습니다. 락인이란 특정 기술 스택이나 플랫폼에 종속되어 다른 선택지로 전환하기 어려워지는 상황을 말합니다.

    저는 얼마전 중국 출장 중 중국 내에서 딥시크를 써봤는데, 솔직히 성능이 놀라웠습니다. 클로드가 VPN으로도 연결이 잘 안 되는 상황이라서 딥시크로 중국 기업 정보를 알아보니, 중국 포털 검색보다 훨씬 정확하게 나왔습니다. 중국 내 데이터가 이 모델에 얼마나 촘촘하게 쌓여 있는지를 체감하게 되었습니다. 

    K-AI 모델

    저는 처음에는 한국이 좋은 모델만 내놓으면 어느 정도 경쟁이 되지 않을까 막연하게 생각했습니다. 그런데 지금 시장 구도를 보면, 그 생각이 너무 단순했다는 것을 인정하게 됩니다. 현재 정부 주도로 추진 중인 독자 AI 파운데이션 모델, 일명 '독파모' 사업에는 SK, LG, 업스테이지, 모티프 네 개 팀이 경쟁 중입니다. 2025년 8월 2차 평가에서 중간 버전을 오픈 소스로 공개하고, 연말 3차 평가를 거쳐 2027년 상반기에 최종 두 팀을 선정하는 일정입니다. 과학기술정보통신부에 따르면 이 사업에는 총 수천억 원 규모의 예산이 투입될 예정입니다(출처: 과학기술정보통신부). 그런데 냉정하게 보면, 기업들 입장에서 지금 선택지는 이미 둘로 좁혀졌습니다. 미국 최고 모델이냐, 아니면 가성비가 뛰어난 중국 모델이냐입니다. 여기서 한국 모델이 3번째 선택지로 들어오려면 성능만 가지고는 부족합니다. 실제로 기업들이 비용 부담 없이 쓸 수 있는 환경, 그리고 "이렇게 쓰면 이런 효과가 난다"는 구체적인 유스 케이스(use case)가 함께 나와야 합니다. AI 에이전트 시대로 전환되면서 판단 기준 자체가 바뀌었습니다. 예전에는 가장 정확한 모델 하나를 열 번 쓰는 구조였다면, 이제는 충분히 괜찮은 모델을 수천 번 반복 실행해야 하는 구조입니다. 그 맥락에서 가성비가 전략적 핵심이 됐고, 모델 하나만 잘 만든다고 이 판에서 살아남기 어렵습니다. 반도체, 클라우드, 데이터센터, 소프트웨어 생태계가 유기적으로 연결되어야 합니다. 미국과 중국이 AI 패권 전쟁에서 사실상 제2라운드에 돌입한 지금, 우리에게 남은 시간이 많지 않을 수 있습니다. 모델 성능 순위를 논하는 것보다, 어떤 기업들이 실제로 우리 모델을 쓰게 만들 수 있는지에 집중하는 것이 지금 시점에서 더 시급한 문제라고 생각합니다. 

    참고: https://youtu.be/7_23a6wSyws?si=xPJUFHJendplFPn3