JARVIS WEEKLY INSIGHT

주간 AI 브리핑

최근 7일 누적 JSON 데이터를 기준으로 자동 집계한 결과입니다.

최근 7일 핫 키워드

업무자동화 · 7엔터프라이즈 · 7에이전트 · 4컴퓨터유즈 · 4코딩자동화 · 4커스터마이징 · 4추론 · 4비공개동향 · 4

가장 많이 언급된 기업/주체

OpenAI · 18Anthropic · 13Google · 11Codex · 8과기정통부 · 8NIPA · 8Vertex AI · 7NVIDIA · 6

흐름 요약

최근 7일 기준으로 업무자동화 관련 이슈가 가장 많이 보였고, 기업 기준으로는 OpenAI 언급이 가장 많았습니다.

국가 분포는 미국 28건, 국내 13건 수준이며, 카테고리는 에이전트/모델 업그레이드 12건, AI 자동화 8건, ERP/업무시스템 5건 순으로 두드러졌습니다.

즉 이번 주는 모델 자체보다 시장 경쟁, 반도체/인프라, 산업 적용 흐름이 강하게 나타났습니다.

1
미국 · AI 자동화
OpenAI, GPT-5.4로 ‘답변형 모델’에서 ‘실행형 업무 에이전트’로 한 단계 이동
OpenAI는 GPT-5.4를 ChatGPT, API, Codex에 동시 전개하며 추론·코딩·에이전트 워크플로우를 하나로 묶었다. 공식 발표 기준으로 GPT-5.4는 100만 토큰 컨텍스트, 네이티브 컴퓨터 유즈, 툴 검색, 문서·스프레드시트·프레젠테이션 작업 강화를 전면에 내세웠다. 벤치마크에서도 GDPval 83.0%, OSWorld-Verified 75.0%, Toolathlon 54.6%로 GPT-5.2 대비 큰 폭의 개선을 제시했다.
해석: 팀장님 관점에서는 단순 모델 출시가 아니라 사무·개발 자동화의 단가가 더 내려간 사건입니다. 특히 컴퓨터 유즈와 툴 검색은 실제 업무 끝단까지 들어갈 수 있다는 뜻이라, 내부 리서치·문서작성·반복 개발업무 자동화 파일럿을 더 적극적으로 검토할 구간입니다. 투자 관점에서는 ‘잘 답하는 모델’보다 ‘툴을 붙여 끝까지 처리하는 플랫폼’ 쪽이 더 높은 기업가치를 방어할 가능성이 큽니다.
2
국내 · AI 자동화
오픈AI ‘심포니’ 공개…코딩 자동화를 넘어 프로젝트 운영 자체를 에이전트화
AI타임스에 따르면 OpenAI는 여러 코딩 에이전트를 작업 단위로 관리하는 오픈소스 프레임워크 ‘Symphony’를 공개했다. 이슈 트래커 상태 변화에 맞춰 에이전트가 자동으로 실행되고, 코드 작성뿐 아니라 테스트·CI·PR 검증·작업 증명까지 포함해 독립 실행 환경에서 병렬 처리하는 구조다. 개발자는 직접 구현하는 사람이 아니라 작업을 정의하고 결과를 검수하는 역할로 이동하게 된다.
해석: 이건 개발 생산성 뉴스가 아니라 ‘관리 가능한 에이전트 운영체제’의 시작으로 보는 게 맞습니다. 사업 관점에서는 향후 개발 외의 문서, 운영, 고객지원 워크플로우에도 같은 구조가 확장될 수 있습니다. 실행 관점에서는 팀장님 조직에서도 티켓 기반 반복작업을 에이전트 큐 형태로 나누면 즉시 실험 가능한 패턴입니다.
3
미국 · 에이전트/모델 업그레이드
OpenAI·Anthropic 경쟁, 이제는 API 판매보다 ‘기업 맞춤 구축 사업’으로 이동
Reuters에 따르면 OpenAI는 사모펀드와의 합작 구조까지 제안하며 기업 고객 맞춤형 AI 구축 비용을 흡수하려 하고 있다. 엔지니어 투입, 커스터마이징, 현장 구현을 포함한 구축형 매출 모델을 강화해 Anthropic과의 엔터프라이즈 전쟁을 벌이는 흐름이다. 이는 범용 API보다 고객사 프로세스 안에 깊게 박히는 사업이 더 중요해졌음을 보여준다.
해석: 모델 성능 자체보다 고객 업무흐름에 들어가 장기 매출을 만들 수 있느냐가 진짜 승부처입니다. 투자 관점에서도 사용량 변동성이 큰 API보다 구축·운영형 매출은 멀티플 방어력이 더 좋습니다. 팀장님 입장에서는 향후 AI 사업 파트너를 볼 때 모델 데모보다 현장 커스터마이징 능력과 운영 인력 구조를 먼저 봐야 합니다.
4
미국 · 에이전트/모델 업그레이드
Google, Gemini 3.1 Pro를 소비자·개발자·기업 채널에 동시 확장…배포력으로 OpenAI 추격
Google은 Gemini 3.1 Pro를 Gemini API, Vertex AI, Gemini 앱, NotebookLM까지 동시에 전개했다. 공식 블로그 기준으로 ARC-AGI-2 검증 점수 77.1%를 제시하며 복잡한 문제 해결 역량 강화를 강조했고, 실사용 예시도 단순 대화가 아니라 데이터 종합, 시각화, 인터랙티브 프로토타이핑에 맞췄다. 핵심은 연구 성능 발표가 아니라 배포 채널 전체에 같은 플래그십을 미는 전략이다.
해석: 경쟁 영향이 큽니다. Google은 단일 모델 우위보다 Workspace·NotebookLM·Vertex에 동시에 꽂아 넣는 방식으로 시장 점유율을 넓히고 있습니다. 팀장님 관점에서는 문서·지식자산 활용이 많은 조직일수록 Google 계열 에이전트가 빠르게 침투할 수 있으므로, 도구 락인 리스크와 전환비용을 함께 점검해야 합니다.
5
미국 · 에이전트/모델 업그레이드
Google, Flash-Lite로 ‘싸고 빠른 업무형 AI’ 포지션 강화…대량 자동화 시장 공략
Google은 Gemini 3.1 Flash-Lite를 공개하며 고속·저원가 워크로드를 전면에 내세웠다. 공식 발표 기준 가격은 입력 100만 토큰당 0.25달러, 출력 1.50달러이며, 2.5 Flash 대비 초기 응답속도 2.5배, 출력 속도 45% 개선을 강조했다. 번역, 콘텐츠 검수, UI 생성, 시뮬레이션 등 고빈도 반복 업무에 맞춘 모델 포지셔닝이 분명하다.
해석: 사업성 측면에서 매우 중요합니다. 실제 전사 배포는 최고 지능보다 비용·속도·운영안정성이 좌우하기 때문입니다. 팀장님 기준으로 백오피스 자동화, 고객응대 보조, 대량 문서처리에는 이런 저원가 고속형 모델이 더 현실적인 선택지이며, 시장 전체의 평균 AI 도입 단가를 낮추는 요인이 됩니다.
6
미국 · 에이전트/모델 업그레이드
공식 출시 전후 신호를 보면 xAI와 Google 모두 ‘행동하는 모델’로 급하게 이동 중
xAI 문서에는 이미 grok-4.20-reasoning, grok-4.20-multi-agent, 서버사이드 웹검색/코드실행 과금 구조가 노출돼 있어 멀티에이전트 리서치 상용화가 상당히 진척된 것으로 보인다. 동시에 AI타임스는 Google 내부 코딩 에이전트 ‘Agent Smith’가 과도한 수요로 접근 제한이 논의될 정도라고 전했다. 내부 생산성에서 먼저 검증된 기능이 곧 외부 엔터프라이즈 제품으로 내려오는 전형적 패턴이다.
해석: 이 카드는 단순 루머가 아니라 방향성 신호입니다. 주요 사업자들이 모두 ‘잘 말하는 모델’보다 ‘툴을 써서 결과를 내는 멀티에이전트 체계’로 이동하고 있다는 뜻입니다. 투자 관점에서는 모델 회사만 보지 말고, 멀티에이전트 운영·관제·감사로그·비용통제 레이어를 잡는 사업도 같이 볼 필요가 있습니다.