
Grok 4.3 上 Bedrock、Vercel Eve 开源——AI HOT 今日热点(2026-06-18)
本期筛选 AI HOT 2026-06-18 日报中的 25 条高价值动态:Grok 4.3 登陆 Amazon Bedrock,Vercel Eve 与 Databricks Omnigent 推动智能体工程化,OpenAI 成本结构被泄露文件放大。行业侧关注 G7 AI 联盟提议、中国筹建世界人工智能合作组织,以及 Databricks、Anthropic 韩国生态等企业进展。

今天的主线很集中:模型进入企业云市场,智能体开发框架继续升温,AI 公司的成本账也被摆到台面。AI HOT 2026-06-18 日报共返回 29 条,本期按读者决策价值筛出 25 条,覆盖模型、产品、行业、论文和实践观点五个板块。
先看 5 件事
- Grok 4.3 登陆 Amazon Bedrock:xAI 称该模型支持 100 万 token 上下文,并按输入每百万 token 1.25 美元、输出每百万 token 2.50 美元计价,主攻企业云调用场景。1
- Vercel Eve 开源:Eve 把「一个智能体」落成一个文件目录,目录直接承载模型、指令、工具、技能、连接和子智能体,目标是降低生产级 Agent 编排的工程摩擦。2
- OpenAI 成本压力被重新放大:泄露财务文件显示,OpenAI 2025 年营收 130.7 亿美元,但研发成本、推理成本和销售营销支出合计已把运营亏损推至 209.2 亿美元。3
- AI 治理出现两条路线:Dario Amodei 与 Demis Hassabis 在 G7 闭门会议上呼吁组建美国主导的 AI 规则联盟,中国则推进世界人工智能合作组织筹建。45
- 物理世界研究正在智能体化:NVIDIA GEAR 实验室的 ENPIRE 让 8 个 Codex 智能体控制 8 台机器人并行做物理实验,已经覆盖扎带、整理细针、安装 GPU 等任务。6
模型发布/更新
- MolmoMotion 把语言指令转成 3D 运动轨迹。 Allen AI 在 Hugging Face 发布 MolmoMotion:输入视频帧、物体 3D 点标记和文字动作指令后,模型预测未来数秒内的 3D 轨迹。团队同时开源 MolmoMotion-1M 数据集和 PointMotionBench 基准,前者包含 116 万视频的 3D 点轨迹及动作描述,后者包含 2700 个人工验证视频片段。7
- Grok 4.3 进入 Amazon Bedrock。 xAI 称 Grok 4.3 在 Bedrock 上全面可用,支持 100 万 token 上下文和 none、low、medium、high 四档推理努力设置;它在 Artificial Analysis Omniscience、Tau2 Telecom、Vals AI Case Law 和 Corporate Finance 等基准中拿到靠前成绩。1
产品发布/更新
- Vercel Eve:把智能体做成可审计的目录。 Eve 的核心设计是文件系统优先:每个智能体对应一个磁盘目录,内置持久执行、沙箱计算、人机审批、安全连接、多通道和追踪评估。Vercel 内部已用它跑上百个智能体,包括月处理 3 万多次查询的数据分析工具 d0 和自动销售代理 Lead Agent。2
- Omnigent:Databricks 把多智能体团队框架开源。 Omnigent 允许在一个实时会话里运行 Claude Code、Codex、Cursor、Pi 以及用户自己的智能体,定位是面向 AI 智能体团队的元框架。它来自 Databricks 内部开发工具,由 Matei Zaharia 和 Databricks AI 团队推进。8
콘텐츠 카드를 불러오는 중…
- Google Home Speaker 变成 Gemini 硬件入口。 Google 推出首款专为 Gemini 打造的智能音箱,售价 99.99 美元,支持自然语言请求、多步指令、中途纠正和连续对话;高级 AI 功能需要 Google Home Premium,月费 10 美元或年费 100 美元。9
- Wolfram Language 与 Mathematica 15 加入内置 AI 助手。 Version 15 为每个笔记本加入 AI 助手,新增符号音乐、大规模时间序列与事件序列处理、分类数据计算和 ModelFit 等能力;笔记本还支持千兆字节级大小、实时查找、侧边栏和视觉主题。10
- 阿里云 HappyOyster 1.0 主打实时可交互数字世界。 HappyOyster 1.0 支持多模态输入与音视频联合生成,能在生成过程中继续接收用户指令并实时响应画面;官网开放「实时导演」和「世界探索」两种玩法,体验积分会发放至 7 月 17 日。11
- Claude Design 强调品牌一致和代码协同。 Claude Design 更新后支持跨项目使用统一设计系统,并可从 GitHub、设计文件或原始上传导入系统;它也加入桌面端侧边栏入口和 claude.ai/design 独立网页端。Anthropic 称发布首周用户超过 100 万。12
- Strands Robots SDK 把 Hugging Face Hub 接到实体机器人。 AWS 开源的 Strands Robots SDK 将 LeRobot 封装为 AgentTools,默认可在 MuJoCo 模拟中运行,切换到
mode="real"后接入真实机器人;示例可在 Python 3.12+ 的 Linux 或 macOS 笔记本上无硬件、无 GPU 运行。13
行业动态
- G7 闭门讨论里的 AI 联盟提议更硬。 Kim 转述称,Anthropic CEO Dario Amodei 与 Google DeepMind CEO Demis Hassabis 在 G7 闭门会议上呼吁组建美国主导的 AI 规则联盟,并把前沿模型和硬件访问权限作为治理抓手。4
콘텐츠 카드를 불러오는 중…
- OpenAI 的收入增速没有掩盖成本结构。 泄露文件显示,OpenAI 2025 年营收为 130.7 亿美元,研发成本 191.8 亿美元,其中向微软支付 105.9 亿美元;推理计算相关收入成本为 75 亿美元,销售营销成本为 57.3 亿美元。3
- 中国推进世界人工智能合作组织。 中方正筹建世界人工智能合作组织,初步考虑总部设在上海;官方表述强调多边主义、弥合数字和智能鸿沟、推动 AI 向善普惠。5
- Google 发布 ARD 开放规范。 Agentic Resource Discovery 让组织在自有域名托管 catalog,registry 负责索引 catalog 并响应发现请求;规范支持加密验证,客户端连接端点前可以确认发布者身份。14
- Databricks 与 Snowflake 的 AI 收入差距扩大。 Tom Tunguz 写道,Databricks ARR 达 69 亿美元,同比增长 80%;Snowflake ARR 约 53 亿美元,增速 34%。Databricks AI 产品年化收入为 17 亿美元,占总 ARR 约 25%。15
- Anthropic 在首尔办公室绑定韩国企业客户。 Anthropic 宣布启用首尔办公室,并披露 NAVER、Nexon、LG CNS、Hanwha Solutions、Samsung SDS 和 Channel Corp 等合作,其中 NAVER 将 Claude Code 部署给数千名工程师。16
论文研究
- ENPIRE:让 8 个 Codex 智能体做机器人实验。 NVIDIA GEAR 实验室的 ENPIRE 使用 8 个 Codex 智能体控制 8 台机器人,配备 GPU 和 token 预算,并用硬运动极限切断、扭矩受限夹爪等硬件机制保障通宵运行安全。6
콘텐츠 카드를 불러오는 중…
- SGLang-JAX 在 TPU 上优化 Ling-2.6-1T。 LMSYS 团队为 Ling-2.6-1T 开发 Fused MoE V2 Pallas 核,把 MoE 数据移动隐藏在计算中,使 MoE 预填充延迟从 5.16ms 降到 2.42ms;仅替换 MoE 核就让预填充吞吐量提高 24.8%,解码吞吐量提高 18.5% 到 35.3%。17
- LifeSciBench 把生命科学评测做成真实研究任务。 OpenAI 与 173 位博士级生命科学家发布 LifeSciBench,包含 750 个真实研究任务、19020 条细化评分标准,覆盖证据处理、分析、设计优化等工作流;79% 的任务需要多步推理,53% 要求解读图表或 PDF 等附件数据。18
- Google AMIE 从单次问诊走向长期疾病管理。 Google 发表在《自然》的研究展示 AMIE 处理长期疾病管理的能力:它结合 Gemini 长上下文、共情对话智能体和深度思考管理推理智能体,可交叉引用数百页临床指南;盲测中,其整体管理推理与 21 名初级保健医生相当,在计划精确性和指南一致性上得分更高。19
- OpenAI 与 Molecule.one 用 GPT-5.4 优化化学反应。 GPT-5.4 接入 Molecule.one 的自主化学智能体 Maria 后,针对 Chan-Lam 偶联反应提出 TEMPO 等温和氧化剂方案;两轮实验后,88% 的硼酸和 83% 的磺酰胺底物产率提升,平均产率从 16.6% 升至 25.2%。20
技巧与观点
- Matt Pocock 把 skills 做成工程流程约束。 Total TypeScript 作者 Matt Pocock 开源 skills v1,将技能描述的 token 成本降低 63%,并加入
/codebase-design、/domain-modeling、/grilling等技能。21 - baoyu-design 增加本地动画视频导出。 baoyu-design 使用基于
f(t)的声明式动画引擎,任意时间点都可确定画面状态;导出流程采用无头 Chromium 逐帧截图和 ffmpeg 编码,95 秒 30fps 动画需要 2850 次截图循环。22 - Google 拆解 A2UI 与 MCP Apps 的三种集成模式。 Google 将 A2UI 描述为由 JSON payload 定义 UI、宿主原生渲染的声明式框架;MCP Apps 则在 iframe 中使用标准 Web 技术提供自定义界面。三种模式围绕 MCP server、Resources 与 Tool 调用来传递 A2UI JSON。23
- CMU 博客追问预训练是否足够「苦涩」。 文章认为现代基础模型预训练看似遵循 Sutton 的苦涩教训,但训练目标仍由人类在训练循环外选择,完成大规模预训练后再评估下游表现、调整方案并重新运行,这个控制环路仍然粗糙。24
- Gary Marcus 用 Anthropic 事件重提护栏困境。 Marcus 认为特朗普对 Anthropic 的要求暴露了生成式 AI 安全护栏的根本问题:基于 next-token predictor 的大语言模型很难在「过严」与「过松」之间稳定落点。25
今日判断
今天最需要跟进的不是单个产品,而是三个并行变化:第一,模型厂商正在用云平台、硬件入口和企业设计工具争夺默认调用位置;第二,智能体框架从「演示」转向文件系统、目录、registry、审批和追踪这些工程细节;第三,OpenAI 的财务泄露让大模型规模化的成本问题重新变得具体。对开发者来说,Eve、ARD、SGLang-JAX 和 LifeSciBench 都值得单独打开看;对产品和投资读者来说,Grok 上 Bedrock、Anthropic 韩国扩张、Databricks AI ARR 和 OpenAI 成本结构更直接影响选型与判断。
참고 출처
- 1xAI:Grok 4.3 on Amazon Bedrock
- 2MarkTechPost:Vercel Releases Eve
- 3Ars Technica:Leaked financial docs show OpenAI is losing billions
- 4Kim:G7 AI alliance discussion
- 5IT之家:中国加紧筹建世界人工智能合作组织
- 6Jim Fan:ENPIRE physical-world autonomous research
- 7Hugging Face:MolmoMotion
- 8Yuchen Jin:Omnigent open source announcement
- 9TechCrunch:Google bets on Gemini to reinvent smart-home speaker
- 10Stephen Wolfram:Launching Version 15 of Wolfram Language & Mathematica
- 11IT之家:阿里云发布 HappyOyster 1.0
- 12Claude Blog:Claude Design stays on brand
- 13Hugging Face:Strands Robots SDK
- 14Google Developers Blog:Agentic Resource Discovery specification
- 15Tomer Tunguz:Databricks Widens Its Lead Over Snowflake
- 16Anthropic:Seoul office and Korean AI ecosystem partnerships
- 17LMSYS:Optimizing Ling-2.6-1T on TPU with SGLang-JAX
- 18OpenAI:Introducing LifeSciBench
- 19Google Blog:AMIE for disease management in Nature
- 20OpenAI:AI chemist improves reaction
- 21阿易 AI Notes:Matt Pocock skills v1
- 22宝玉:baoyu-design animation video export
- 23Google Developers Blog:A2UI and MCP Apps
- 24CMU Machine Learning Blog:Pre-training isn't bitter enough
- 25Gary Marcus:Trump asks the impossible of Anthropic
이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.