Google 23

(2026-03-26) TurboQuant 모델과 Throughput에 대한 고찰

최근 TurboQuant 양자화에 대한 기사가 종종 올라옵니다. 메모리 반감 이슈 때문에 많은 관심을 쏟고 있는데요.​저는 보면서, 이게 그렇게 메모리 자체에 대한 사용을 줄일 수 있는가에 집중을 해서 논문을 다시 한번 읽어 보았습니다. ​일단 TurboQuant 양자화의 경우는 현재, 모델 Quantization에는 적용되어 테스트 하지 않은 것으로 보입니다. ​어 이거 기존 AGQ, GPTQ 같은 거 아닌가 생각하신 분들에게는 좀 생소할 수 있는데, 논문에서 나온 부분은 KV Cache에 대한 부분과 Embedding Vector에 대한 부분만을 중점으로 다루고 있습니다. ​모델 Qunatization은 예전부터 많이 수행해 오고 있으며, 실제로 사내 모델을 활용할 때에는 적용을 이미 하고 있습니다...

AI 2026.03.28

(2026-02-20) Gemini 3.1 Pro - 압도적인 추론 성능

최근 구글(Google)이 새로운 AI 모델인 'Gemini 3.1 Pro (Thinking High)'의 벤치마크 결과를 공개했습니다. 이번에 공개된 성적표는 그야말로 놀라운 수준인데요. 전작인 Gemini 3 Pro는 물론이고, 강력한 경쟁 모델인 Anthropic의 Opus 4.6, Sonnet 4.6, 그리고 OpenAI의 GPT-5.2, GPT-5.3-Codex와 비교했을 때 다수의 지표에서 우위를 점하며 차세대 AI 모델의 새로운 기준을 제시하고 있습니다.​이번 벤치마크 표를 통해 한번 최근 AI 모델 성능향상을 감상해 보시죠.​​차원이 다른 추론(Reasoning)​먼저 벤치마크 매트릭스를 보여드리겠습니다. 각각의 벤치마크는 특정한 특성을 보여주고 있습니다. 가장 눈에 띄는 부분은 고도의 ..

AI 2026.02.20

(2025-12-31) Google Antigravity 사용법 - #11. Browser Agent 에서 Javascript 자동 실행

Antigravity Browser SubAgent를 활용하여 워크플로우를 자동화하다 보면 마주치는 지점이 있습니다. ​ Javascript를 실행할 때마다 매번 나타나는 승인 팝업은 전체적인 효율을 떨어뜨리는 요소입니다. 동일한 학인의 입장에서 이 확인 절차를 생략하고 자율성을 높이는 방법을 같이 살펴보시죠.​ 브라우저 서브에이전트가 코드를 실행할 때마다 사용자의 클릭을 기다리는 것은 에이전트 본연의 목적에 어긋납니다. 보안을 위해 설계된 이 장치는 설정 변경과 몇 가지 기술적 접근을 통해 우회할 수 있습니다. 저 또한 이 과정을 해결하기 위해 시스템 내부 정책과 우회 스크립트를 분석해 보았습니다.​시스템 정책 수정으로 실행의 연속성을 확보터보 모드 전환을 통한 워크플로우 단축 및 시스템 권한 획득An..

Agent 2025.12.31

(2025-12-30) 2026년, AI는 '대화'에서 '행동'으로 진화한다 - 메타의 마누스 인수가 의미하는 것

2025년 12월 29일, AI 업계에 주목할 만한 소식이 전해졌습니다. 메타(Meta)가 에이전트 AI 스타트업 마누스(Manus)를 인수한다고 발표한 것입니다. 인수 금액은 공식적으로 공개되지 않았습니다. 다만 마누스의 모회사인 버터플라이 이펙트(Butterfly Effect)가 2025년 4월 벤치마크(Benchmark) 주도로 7,500만 달러를 유치하며 약 5억 달러의 기업가치를 인정받았던 점을 감안하면, 상당한 규모의 딜이었을 것으로 추정됩니다. 오늘은 이 인수가 가진 의미를 기술적 관점과 시장 관점에서 살펴보겠습니다. 단순한 기업 인수가 아니라, AI 트렌드가 '대화(Conversation)'에서 '행동(Action)'으로 넘어가는 중요한 변곡점이기 때문입니다. 마누스는 어떤 회사인가마누스는..

투자생활 2025.12.30

(2025-12-25) NVIDIA아 Groq을 품다 - TPU 초기 설계자 영입

2024년 12월 24일, 크리스마스 이브에 전해진 엔비디아의 소식은 그야말로 '신의 한 수'라는 표현이 어울립니다.오늘 우리가 살펴볼 주제는 엔비디아가 AI 추론 칩 스타트업 Groq와 맺은 200억 달러 규모의 계약입니다.단순한 인수가 아니라 비독점 라이선스 계약과 핵심 인재 영입을 결합한 독특한 형태라는 점이 흥미롭습니다. 이는 엔비디아 역사상 최대 규모의 거래이며, 2019년 이스라엘 칩 설계 회사 Mellanox를 약 70억 달러에 인수했던 기록을 훌쩍 뛰어넘습니다.이 딜이 왜 발생했는지, 그리고 기술적으로 어떤 의미가 있는지 알아보겠습니다.추론 시장의 경쟁 구도를 바꿀 결정적인 열쇠엔비디아가 왜 굳이 Groq를 선택했을지 고민해 보았습니다.우리는 흔히 엔비디아 GPU가 AI의 모든 영역을 지배..

투자생활 2025.12.25

(2025-12-22) 자율주행의 제왕 웨이모와 테크 업계의 조용한 붕괴

2025년 12월, 테크 업계는 두 가지 상반된 신호를 동시에 보내고 있습니다. 한쪽에서는 자율주행 기술이 실험실을 벗어나 막대한 현금을 창출하는 '실질적 비즈니스'로 폭발하고 있고, 다른 한쪽에서는 그 혁신의 속도를 감당하던 인재들이 소리 없이 무너져 내리는 현상이 목격되고 있습니다. 오늘은 자율주행의 제왕으로 떠오른 웨이모(Waymo)의 놀라운 성장세와 투자 관점, 테슬라와의 치열한 경쟁 구도, 그리고 이를 지탱하는 노동 시장의 어두운 단면인 '콰이어트 크래킹(Quiet Cracking)' 현상에 대해서 알아보겠습니다. 웨이모(Waymo) - '수익' 증명의 시대 구글(Alphabet)의 자율주행 자회사 웨이모가 마침내 '주간 유료 주행 45만 건'이라는 기념비적인 이정표를 세웠습니다. T..

투자생활 2025.12.22

(2025-12-12) Google의 RAG 연구가 보여주는 AI 효율화

최근 LLM 생태계는 모델의 크기 경쟁에서 구조적 효율화 경쟁으로 넘어가고 있습니다. Google이 발표한 일련의 RAG 관련 연구들은 이러한 흐름을 가장 명확하게 보여줍니다. 최신 논문임에도 몇 달만 지나면 예전 것으로 느껴지는 요즘 시대에 과거 RAG 논문을 차례로 훑어보면서 정리해 보는 시간을 가져보도록 하겠습니다. 이들은 단순히 모델의 컨텍스트 윈도우를 늘리는 것을 넘어, RAG 파이프라인 자체를 재설계하여 효율성을 극대화하는 방법에 집중하고 있습니다. 이 부분은 Google이 가지고 있는 특성을 이해하는 것이 좋습니다. RAG 대체안으로 소형 LLM을 통한 장문 분석 또한 시도되고 있지만 제일 중요한 것은 비용 효율과 대규모 User의 적용 용이성이라고 생각됩니다. 수십억 명의 실..

AI 2025.12.12

(2025-11-27) 구글 TPU Ironwood의 성능 스펙

구글의 7세대 TPU인 아이언우드(TPU7x)는 2025년 4월 Google Cloud Next에서 발표되어, 2025년 11월부터 일반 공개(GA)되었습니다. 아이언우드는 추론(Inference) 워크로드에 최적화된 구글의 첫 번째 TPU로, AI 가속기 시장에서 NVIDIA Blackwell과 경쟁하기 위해 설계되었습니다.핵심 사양단일 칩 성능항목사양컴퓨팅 성능4.6 PetaFLOPS (FP8), 2.3 PetaFLOPS (FP16)메모리192 GB HBM3E (Trillium 대비 6배)메모리 대역폭7.37 TB/s (Trillium 대비 4.5배)ICI 대역폭9.6 Tbps 양방향 (Trillium 대비 1.5배)칩렛 구성듀얼 칩렛 (각 1 TensorCore + 2 SparseCore + 9..

AI 2025.11.27

(2025-11-21) Google Antigravity 사용법 - #6. Planning을 통한 Sub Task 구성

#########################################################(2025-11-19) Google Antigravity 사용법 - #1. 주요 기능과 저장소 관리(2025-11-20) Google Antigravity 사용법 - #2. 실제 기능 추가 테스트(2025-11-20) Google Antigravity 사용법 - #3. 모드 선택 및 자동실행 옵션 상세(2025-11-20) Google Antigravity 사용법 - #4. 브라우저 Agent 사용법(2025-11-21) Google Antigravity 사용법 - #5. MCP 서버 이용하기(2025-11-21) Google Antigravity 사용법 - #6. Planning을 통한 SubTask ..

Agent 2025.11.21

(2025-11-20) Google Antigravity 사용법 - #4. 브라우저 Agent 사용법

#########################################################(2025-11-19) Google Antigravity 사용법 - #1. 주요 기능과 저장소 관리(2025-11-20) Google Antigravity 사용법 - #2. 실제 기능 추가 테스트(2025-11-20) Google Antigravity 사용법 - #3. 모드 선택 및 자동실행 옵션 상세(2025-11-20) Google Antigravity 사용법 - #4. 브라우저 Agent 사용법(2025-11-21) Google Antigravity 사용법 - #5. MCP 서버 이용하기(2025-11-21) Google Antigravity 사용법 - #6. Planning을 통한 SubTask ..

Agent 2025.11.20

(2025-11-20) Google Antigravity 사용법 - #3. 모드 선택 및 자동실행 옵션 상세

#########################################################(2025-11-19) Google Antigravity 사용법 - #1. 주요 기능과 저장소 관리(2025-11-20) Google Antigravity 사용법 - #2. 실제 기능 추가 테스트(2025-11-20) Google Antigravity 사용법 - #3. 모드 선택 및 자동실행 옵션 상세(2025-11-20) Google Antigravity 사용법 - #4. 브라우저 Agent 사용법(2025-11-21) Google Antigravity 사용법 - #5. MCP 서버 이용하기(2025-11-21) Google Antigravity 사용법 - #6. Planning을 통한 SubTask ..

Agent 2025.11.20

(2025-11-20) 구글의 귀환 - 300달러의 벽을 넘어서

2025년 11월 19일, 알파벳의 주가가 사상 처음으로 300달러를 돌파하며 300.29달러로 마감했습니다. 이는 단순한 심리적 저항선 돌파를 넘어, 구글의 AI 전략이 시장의 신뢰를 얻고 있다는 중요한 신호입니다.​ 이날 주가는 장중 한때 6.9% 급등하며 투자자들의 뜨거운 관심을 보여주었습니다. 이러한 상승은 기술적 본질과 사업 방향성이 시장의 기대와 맞아떨어진 결과로 해석됩니다.​​제미나이 3: 구글 AI의 진화경쟁력 있는 성능 입증 11월 18일 공개된 제미나이 3는 구글의 최신 AI 모델로, 다양한 벤치마크에서 경쟁력 있는 성능을 보여주었습니다. OpenAI가 일주일 전인 11월 12일 발표한 GPT-5.1과 비교했을 때 다음과 같은 차별점을 가집니다.​제미나이 3의 강점:GPQA Diamon..

투자생활 2025.11.20

(2025-11-20) Google Antigravity 사용법 - #2. 실제 기능 추가 테스트

#########################################################(2025-11-19) Google Antigravity 사용법 - #1. 주요 기능과 저장소 관리(2025-11-20) Google Antigravity 사용법 - #2. 실제 기능 추가 테스트(2025-11-20) Google Antigravity 사용법 - #3. 모드 선택 및 자동실행 옵션 상세(2025-11-20) Google Antigravity 사용법 - #4. 브라우저 Agent 사용법(2025-11-21) Google Antigravity 사용법 - #5. MCP 서버 이용하기(2025-11-21) Google Antigravity 사용법 - #6. Planning을 통한 SubTask ..

Agent 2025.11.20

(2025-11-19) Google Antigravity 사용법 - #1. 주요 기능과 저장소 관리

#########################################################(2025-11-19) Google Antigravity 사용법 - #1. 주요 기능과 저장소 관리(2025-11-20) Google Antigravity 사용법 - #2. 실제 기능 추가 테스트(2025-11-20) Google Antigravity 사용법 - #3. 모드 선택 및 자동실행 옵션 상세(2025-11-20) Google Antigravity 사용법 - #4. 브라우저 Agent 사용법(2025-11-21) Google Antigravity 사용법 - #5. MCP 서버 이용하기(2025-11-21) Google Antigravity 사용법 - #6. Planning을 통한 SubTask ..

Agent 2025.11.19

(2025-11-18) Gemini 3 Pro 스펙 정리

구글 딥마인드가 2025년 11월, 제미나이(Gemini) 시리즈의 차세대 모델인 'Gemini 3 Pro'의 모델 카드를 공개했습니다.​ 제공된 문서를 바탕으로 이 모델의 핵심적인 변화와 기술적 특징을 알아보도록 하겠습니다.​​거대 모델의 효율성을 극대화한 아키텍처를 채택하다​ Gemini 3 Pro는 최신 아키텍처를 대거 수용하여 구성되었습니다. ​ 최근 모델에 많이 적용되고 있는, 희소 전문가 혼합(Sparse Mixture-of-Experts, MoE) 트랜스포머 아키텍처를 기반으로 설계되었습니다.​ 모든 파라미터를 매번 사용하는 것이 아니라, 입력 토큰에 따라 최적의 파라미터(전문가) 그룹만을 동적으로 라우팅하여 활성화합니다.​ 이러한 구조적 특징 덕분에 모델의 총 용량은 비약적으로 늘리면서도,..

Agent 2025.11.18

(2025-11-08) Test-Time Diffusion Deep Researcher: 확산 모델로 연구하는 AI

현재 대부분의 공개 연구 에이전트는 사고의 사슬이나 다중 답변 생성 같은 영리한 기법을 사용합니다.하지만 이들은 인간 연구의 본질을 놓치고 있습니다.복잡한 주제로 논문을 작성할 때 우리는 계획을 세우고, 초안을 쓰고, 조사하며, 피드백을 받아 다시 수정합니다. 이 과정에서 핵심은 누락된 정보를 찾거나 주장을 강화하기 위해 추가 연구를 수행하는 것입니다.흥미롭게도, 이러한 인간의 패턴은 확산 모델의 메커니즘과 놀랍도록 유사합니다.확산 과정으로 본 연구 작성AI 에이전트의 초안이 노이즈이고, 검색이 노이즈 제거TTD-DR(Test-Time Diffusion Deep Researcher)은 연구 보고서 작성을 확산 과정으로 모델링하는 최초의 연구 에이전트입니다.지저분한 초안을 점진적으로 다듬어 고품질 최종본을..

Agent 2025.11.08

(2025-10-28) Amazon의 대규모 해고 - 기사회생 인가 아니면 무리수?

최근에 나온 아마존의 60만명 Lay Off소식에 놀라지 않은 분들은 없을 것입니다. 진짜로 그렇게 AI가 발전했다고? AWS도 영향이 가는 거야?​ 내용을 들여다 보니, 물류 자동화쪽으로 초점이 맞추어 있는 것 같습니다. 하지만, 일부 다른 세그먼트에도 불필요한 인력을 제거하고, 자동화에 대한 대대적인 적용을 예고하는 것 같습니다.​ 우리는 투자자의 관점에서 해당하는 내용을 살펴보고, 이후 투자 방향에 대해서 살펴보고자 합니다.​​소문이 현실이 되다​ 2025년 10월 말, 기술 업계는 충격적인 소식을 접합니다. 아마존이 최대 30,000명의 사무직 직원을 감축한다는 보도가 나왔습니다. 이는 회사 사무직 인력의 거의 10%에 해당하는 규모입니다. 공식 발표는 CEO가 아닌 인사 담당 수석 부사장 베스 ..

투자생활 2025.10.29

(2025-10-25) Gemini Pro Veo 3.1 동영상 모델 실사용 리뷰: 연속 애니메이션 생성의 가능성과 한계

업데이트 발견: Veo 3.1의 등장Gemini Pro를 꾸준히 사용해온 유저로서, 오늘 평소처럼 사이트에 접속했더니 흥미로운 변화를 발견했습니다. UI가 새롭게 개편되었을 뿐만 아니라, Veo 3.1 동영상 모델로의 업그레이드가 눈에 띄게 표시되어 있었습니다.그동안 Veo 3까지는 다양한 테스트를 진행하며 성능과 한계를 파악했던 터라, 3.1 버전에서는 어떤 개선이 이루어졌을지 기대감을 갖고 즉시 테스트에 들어갔습니다.결과를 한 마디로 요약하자면? "GOOD!!!"하지만 여전히 개선이 필요한 부분들도 발견했습니다. 자세한 테스트 결과를 공유합니다.테스트 1: 기본 애니메이션 생성 능력프롬프트와 결과첫 번째 테스트는 단일 프롬프트로 얼마나 완성도 높은 애니메이션을 생성하는지 확인했습니다.사용 프롬프트: ..

AI 2025.10.25

(2025-09-08) 브로드컴 너도 점프를? #3. 나도 있단다. 마블, AMD

AI 훈련용 GPU 시장에서 엔비디아의 지배력은 잘 확립되어 있지만, 더 넓은 AI 가속기 시장은 결코 독점이 아닙니다. 특히 맞춤형 실리콘 및 대체 가속기 분야에서 역동적이고 점점 더 세분화된 경쟁 환경이 나타나고 있습니다. 이 분야는 기업들이 모든 전선에서 정면으로 경쟁하는 것이 아니라 전문화된 틈새 시장을 개척하는 뚜렷한 전략적 경로로 특징지어집니다. 브로드컴에게 이 비-엔비디아 생태계를 이해하는 것은 매우 중요합니다. 이들 플레이어는 맞춤형 설계 수주를 위한 직접적인 경쟁자이자 동일한 하이퍼스케일 고객에게 다른 아키텍처 솔루션을 제공하는 간접적인 경쟁자이기 때문입니다. 모든 AI 칩의 성공은 이제 주요 클라우드 서비스 제공업체에 의한 채택과 불가분하게 연결되어 있으며, 이러한 파트너십이 시장 관련..

투자생활 2025.09.08

(2025-08-26) NVIDIA의 독주, 흔들리는 중국 시장 속 외줄타기 #2. 경쟁사 분석

앞에서 재무 분석을 위주로 주가 추이를 보았다면, 지금은 외부 환경 특히 경쟁사 환경에 대해서 좀 자세하게 살펴보겠습니다.​새로운 경쟁의 서막​ NVIDIA의 독주 체제에 도전하는 경쟁 구도는 지정학적 변수와 기술적 차별화 전략이 복잡하게 얽혀 있습니다. 이 경쟁은 중국 내 자국산 칩과 글로벌 빅테크 기업들의 대안이라는 두 개의 큰 축으로 전개되고 있습니다. ​​Huawei의 부상Ascend 910B, 910C로 H200 추격. 상호연결성과 S/W 한계 Huawei의 Ascend 910B는 NVIDIA의 A100/H100급 GPU에 대한 중국의 가장 현실적인 대안으로 평가받습니다. 서류상 성능은 인상적이지만, 실제 대규모 모델 훈련에서는 상호연결 기술과 소프트웨어 스택의 한계로 인해 어려움을 겪고 있습니..

투자생활 2025.08.26

(2025-08-24) Google은 어떻게 AI 에너지를 길들였나.

최근 AI 운영, 특히 LLM이 소비하는 에너지에 대한 우려가 많습니다. 혹자는 데이터 센터 운영을 우주, 아니면 아예 달에서 운영해야 한다고 말하니다. 여기에 구글이 직접 운영하면서 나온 일종의 중간 보고 내용이 있어서 공유하고자 합니다. ​​AI 에너지 효율 33배 향상, 구글은 어떻게 괴물을 길들였나? 구글이 최근 AI 모델의 에너지 효율성을 획기적으로 개선했다고 발표했습니다. 지난 1년간 제미나이(Gemini) 앱의 텍스트 프롬프트 처리에 필요한 에너지 비용을 33배, 관련 탄소 발자국은 44배 줄였다는 내용이 핵심입니다. 이는 AI 기술의 지속가능성에 대한 중요한 이정표가 될 수 있습니다.​​프롬프트 하나를 처리하는 데 소비되는 에너지는 약 0.24와트시(Wh) 구글의 발표에 따르면, 이제 제..

AI 2025.08.24

(2025-08-21) Google AI Studio를 이용한 Gemini 다루기 #5. 이미지는 Whisk지... API는 아직...

AI Studio 에서 이미지 창작 영역은 아직 미흡한 부분이 보입니다. ​ 그렇다면, Google에서는 이미지 영역에 대한 부분이 약한가? 전혀!!​ 현재 최종 사용자 용으로 제공하는 whisk 라는 서비스를 이용해보면, 진짜 깔끔한 이미지 생성을 얻을 수 있습니다.​​ Whisk. 일반 사용자용 이미지 생성 먼저 다음 사이트에 접속해 봅니다. (https://labs.google/fx/tools/whisk) Whisk - labs.google/fxA new experimental tool that lets you use images as prompts to visualize your ideas and tell your story.labs.google 여기에서 ENTER TOOL을 선택하고, ​이후에 ..

AI 2025.08.22

(2025-08-21) Google AI Studio를 이용한 Gemini 다루기 #4. 이미지를 만들꺼야? 고칠꺼야?

AI를 이용하여 이미지를 다룰 때, 주의할 사항은​ "이미지를 완전히 새롭게 생성할 것인가?" 아니면​ "기존 이미지를 토대로 수정을 할 것인가?" 입니다. ​ 여기에서, 이미지를 완전히 새롭게 생성하는 것은 도리어 쉽습니다. 쉽다는 뜻은 신규 생성 모델, 특히 좋은 품질의 이미지 모델은 매우 많다는 것입니다. ​ AI Studio에서도 마찬가지입니다. 그럼 먼저 새롭게 생성하는 기능부터 살펴보겠습니다. ​​이미지 생성​ 이미지 생성이 가능한 방법은 크게 두가지가 있습니다. ​MultiModal LLM - Gemini 2.0 Flash preview Image generationImagen​엉 ? 왜 이미지 생성을 하는데 두가지 방법이 있지 ?​음. 이게 좀 역사가 있는데, 원래 이미지 생성용 모델은 별..

AI 2025.08.22
반응형