Grok 4.3 上 Bedrock、Vercel Eve 开源——AI HOT 今日热点（2026-06-18）

今天的主线很集中：模型进入企业云市场，智能体开发框架继续升温，AI 公司的成本账也被摆到台面。AI HOT 2026-06-18 日报共返回 29 条，本期按读者决策价值筛出 25 条，覆盖模型、产品、行业、论文和实践观点五个板块。

先看 5 件事

Grok 4.3 登陆 Amazon Bedrock：xAI 称该模型支持 100 万 token 上下文，并按输入每百万 token 1.25 美元、输出每百万 token 2.50 美元计价，主攻企业云调用场景。1
Vercel Eve 开源：Eve 把「一个智能体」落成一个文件目录，目录直接承载模型、指令、工具、技能、连接和子智能体，目标是降低生产级 Agent 编排的工程摩擦。2
OpenAI 成本压力被重新放大：泄露财务文件显示，OpenAI 2025 年营收 130.7 亿美元，但研发成本、推理成本和销售营销支出合计已把运营亏损推至 209.2 亿美元。3
AI 治理出现两条路线：Dario Amodei 与 Demis Hassabis 在 G7 闭门会议上呼吁组建美国主导的 AI 规则联盟，中国则推进世界人工智能合作组织筹建。4 5
物理世界研究正在智能体化：NVIDIA GEAR 实验室的 ENPIRE 让 8 个 Codex 智能体控制 8 台机器人并行做物理实验，已经覆盖扎带、整理细针、安装 GPU 等任务。6

模型发布/更新

MolmoMotion 把语言指令转成 3D 运动轨迹。 Allen AI 在 Hugging Face 发布 MolmoMotion：输入视频帧、物体 3D 点标记和文字动作指令后，模型预测未来数秒内的 3D 轨迹。团队同时开源 MolmoMotion-1M 数据集和 PointMotionBench 基准，前者包含 116 万视频的 3D 点轨迹及动作描述，后者包含 2700 个人工验证视频片段。7
Grok 4.3 进入 Amazon Bedrock。 xAI 称 Grok 4.3 在 Bedrock 上全面可用，支持 100 万 token 上下文和 none、low、medium、high 四档推理努力设置；它在 Artificial Analysis Omniscience、Tau2 Telecom、Vals AI Case Law 和 Corporate Finance 等基准中拿到靠前成绩。1

产品发布/更新

Vercel Eve：把智能体做成可审计的目录。 Eve 的核心设计是文件系统优先：每个智能体对应一个磁盘目录，内置持久执行、沙箱计算、人机审批、安全连接、多通道和追踪评估。Vercel 内部已用它跑上百个智能体，包括月处理 3 万多次查询的数据分析工具 d0 和自动销售代理 Lead Agent。2
Omnigent：Databricks 把多智能体团队框架开源。 Omnigent 允许在一个实时会话里运行 Claude Code、Codex、Cursor、Pi 以及用户自己的智能体，定位是面向 AI 智能体团队的元框架。它来自 Databricks 内部开发工具，由 Matei Zaharia 和 Databricks AI 团队推进。8

콘텐츠 카드를 불러오는 중…

Google Home Speaker 变成 Gemini 硬件入口。 Google 推出首款专为 Gemini 打造的智能音箱，售价 99.99 美元，支持自然语言请求、多步指令、中途纠正和连续对话；高级 AI 功能需要 Google Home Premium，月费 10 美元或年费 100 美元。9
Wolfram Language 与 Mathematica 15 加入内置 AI 助手。 Version 15 为每个笔记本加入 AI 助手，新增符号音乐、大规模时间序列与事件序列处理、分类数据计算和 ModelFit 等能力；笔记本还支持千兆字节级大小、实时查找、侧边栏和视觉主题。10
阿里云 HappyOyster 1.0 主打实时可交互数字世界。 HappyOyster 1.0 支持多模态输入与音视频联合生成，能在生成过程中继续接收用户指令并实时响应画面；官网开放「实时导演」和「世界探索」两种玩法，体验积分会发放至 7 月 17 日。11
Claude Design 强调品牌一致和代码协同。 Claude Design 更新后支持跨项目使用统一设计系统，并可从 GitHub、设计文件或原始上传导入系统；它也加入桌面端侧边栏入口和 claude.ai/design 独立网页端。Anthropic 称发布首周用户超过 100 万。12
Strands Robots SDK 把 Hugging Face Hub 接到实体机器人。 AWS 开源的 Strands Robots SDK 将 LeRobot 封装为 AgentTools，默认可在 MuJoCo 模拟中运行，切换到 mode="real" 后接入真实机器人；示例可在 Python 3.12+ 的 Linux 或 macOS 笔记本上无硬件、无 GPU 运行。13

行业动态

G7 闭门讨论里的 AI 联盟提议更硬。 Kim 转述称，Anthropic CEO Dario Amodei 与 Google DeepMind CEO Demis Hassabis 在 G7 闭门会议上呼吁组建美国主导的 AI 规则联盟，并把前沿模型和硬件访问权限作为治理抓手。4

콘텐츠 카드를 불러오는 중…

OpenAI 的收入增速没有掩盖成本结构。 泄露文件显示，OpenAI 2025 年营收为 130.7 亿美元，研发成本 191.8 亿美元，其中向微软支付 105.9 亿美元；推理计算相关收入成本为 75 亿美元，销售营销成本为 57.3 亿美元。3
中国推进世界人工智能合作组织。 中方正筹建世界人工智能合作组织，初步考虑总部设在上海；官方表述强调多边主义、弥合数字和智能鸿沟、推动 AI 向善普惠。5
Google 发布 ARD 开放规范。 Agentic Resource Discovery 让组织在自有域名托管 catalog，registry 负责索引 catalog 并响应发现请求；规范支持加密验证，客户端连接端点前可以确认发布者身份。14
Databricks 与 Snowflake 的 AI 收入差距扩大。 Tom Tunguz 写道，Databricks ARR 达 69 亿美元，同比增长 80%；Snowflake ARR 约 53 亿美元，增速 34%。Databricks AI 产品年化收入为 17 亿美元，占总 ARR 约 25%。15
Anthropic 在首尔办公室绑定韩国企业客户。 Anthropic 宣布启用首尔办公室，并披露 NAVER、Nexon、LG CNS、Hanwha Solutions、Samsung SDS 和 Channel Corp 等合作，其中 NAVER 将 Claude Code 部署给数千名工程师。16

论文研究

ENPIRE：让 8 个 Codex 智能体做机器人实验。 NVIDIA GEAR 实验室的 ENPIRE 使用 8 个 Codex 智能体控制 8 台机器人，配备 GPU 和 token 预算，并用硬运动极限切断、扭矩受限夹爪等硬件机制保障通宵运行安全。6

콘텐츠 카드를 불러오는 중…

SGLang-JAX 在 TPU 上优化 Ling-2.6-1T。 LMSYS 团队为 Ling-2.6-1T 开发 Fused MoE V2 Pallas 核，把 MoE 数据移动隐藏在计算中，使 MoE 预填充延迟从 5.16ms 降到 2.42ms；仅替换 MoE 核就让预填充吞吐量提高 24.8%，解码吞吐量提高 18.5% 到 35.3%。17
LifeSciBench 把生命科学评测做成真实研究任务。 OpenAI 与 173 位博士级生命科学家发布 LifeSciBench，包含 750 个真实研究任务、19020 条细化评分标准，覆盖证据处理、分析、设计优化等工作流；79% 的任务需要多步推理，53% 要求解读图表或 PDF 等附件数据。18
Google AMIE 从单次问诊走向长期疾病管理。 Google 发表在《自然》的研究展示 AMIE 处理长期疾病管理的能力：它结合 Gemini 长上下文、共情对话智能体和深度思考管理推理智能体，可交叉引用数百页临床指南；盲测中，其整体管理推理与 21 名初级保健医生相当，在计划精确性和指南一致性上得分更高。19
OpenAI 与 Molecule.one 用 GPT-5.4 优化化学反应。 GPT-5.4 接入 Molecule.one 的自主化学智能体 Maria 后，针对 Chan-Lam 偶联反应提出 TEMPO 等温和氧化剂方案；两轮实验后，88% 的硼酸和 83% 的磺酰胺底物产率提升，平均产率从 16.6% 升至 25.2%。20

技巧与观点

Matt Pocock 把 skills 做成工程流程约束。 Total TypeScript 作者 Matt Pocock 开源 skills v1，将技能描述的 token 成本降低 63%，并加入 /codebase-design、/domain-modeling、/grilling 等技能。21
baoyu-design 增加本地动画视频导出。 baoyu-design 使用基于 f(t) 的声明式动画引擎，任意时间点都可确定画面状态；导出流程采用无头 Chromium 逐帧截图和 ffmpeg 编码，95 秒 30fps 动画需要 2850 次截图循环。22
Google 拆解 A2UI 与 MCP Apps 的三种集成模式。 Google 将 A2UI 描述为由 JSON payload 定义 UI、宿主原生渲染的声明式框架；MCP Apps 则在 iframe 中使用标准 Web 技术提供自定义界面。三种模式围绕 MCP server、Resources 与 Tool 调用来传递 A2UI JSON。23
CMU 博客追问预训练是否足够「苦涩」。 文章认为现代基础模型预训练看似遵循 Sutton 的苦涩教训，但训练目标仍由人类在训练循环外选择，完成大规模预训练后再评估下游表现、调整方案并重新运行，这个控制环路仍然粗糙。24
Gary Marcus 用 Anthropic 事件重提护栏困境。 Marcus 认为特朗普对 Anthropic 的要求暴露了生成式 AI 安全护栏的根本问题：基于 next-token predictor 的大语言模型很难在「过严」与「过松」之间稳定落点。25

今日判断

今天最需要跟进的不是单个产品，而是三个并行变化：第一，模型厂商正在用云平台、硬件入口和企业设计工具争夺默认调用位置；第二，智能体框架从「演示」转向文件系统、目录、registry、审批和追踪这些工程细节；第三，OpenAI 的财务泄露让大模型规模化的成本问题重新变得具体。对开发者来说，Eve、ARD、SGLang-JAX 和 LifeSciBench 都值得单独打开看；对产品和投资读者来说，Grok 上 Bedrock、Anthropic 韩国扩张、Databricks AI ARR 和 OpenAI 成本结构更直接影响选型与判断。

Grok 4.3 上 Bedrock、Vercel Eve 开源——AI HOT 今日热点（2026-06-18）

先看 5 件事

模型发布/更新

产品发布/更新

行业动态

论文研究

技巧与观点

今日判断

참고 출처