OpenAI 发布 gpt-oss 开放权重模型 (gpt-oss‑120B, gpt-oss‑20B)
关键更新
OpenAI 发布了两个开放权重模型,gpt-oss‑120B 和 gpt-oss‑20B,采用 Apache‑2.0 许可,提供可下载的权重(原生 MXFP4 量化)、参考推理代码,以及 Harmony 提示格式和渲染器。较大的模型适合在单个 80GB GPU 上运行;较小的模型可以在约 16GB 的机器上运行,两者都支持非常长的上下文窗口(高达 ~128k 令牌)。OpenAI 正在提供参考运行时,并与供应商(Hugging Face、vLLM、Ollama、ONNX/Azure 等)合作,使这些模型能够在本地、云和边缘设置中使用。 (openai.com)
为什么这很重要
这是首次在时间和精力上可行的发布,实质性地改变了高级推理和编码助手的运行方式:团队现在可以在自己的基础设施(甚至高端开发机器)上托管一个有能力的、支持思维链的模型,而不必被锁定在托管的 API 中。实际上,这意味着交互式开发工具的延迟更低,能够将代码和遥测保留在本地以满足合规要求,并对微调和工具集成(IDE 插件、本地推理服务和代理框架)有更大的控制权。
工程权衡是直接但重要的:120B 模型仍然需要大量的 GPU RAM(≈80GB)和优化的运行时以实现生产吞吐量,而 20B 模型则开启了现实的本地和边缘场景(16GB RAM)。预计在两个领域会立即开展工作:(1)操作/工具 — 标准化推理堆栈(量化运行时、vLLM/ONNX 管道、适配器/微调工具)和部署自动化(Kubernetes + GPU 节点大小、推理的自动扩展);(2)安全/流程 — 加固的微调管道、红队和模型安全审计,以及围绕模型更新和提示清理的操作控制。对于构建代码助手或自动化管道的前端和后端开发者来说,此次发布减少了对模型推理的云依赖,但提高了对 MLOps、可观察性(延迟、漂移、幻觉跟踪)和安全模型治理的投资需求。 (openai.com)
来源
继续阅读
AWS CDK 将 CLI 与构造库分离(独立发布和新的 CLI 仓库)
2025年8月31日AWS 宣布 CDK CLI 和 CDK 构造库将独立发布,CLI 将迁移到一个新的仓库——这改变了您在 CI 中版本控制、安装和自动化 CDK 的方式。
Bun 添加 Bun.SQL — 一个零依赖的统一 SQL 客户端 (MySQL, PostgreSQL, SQLite)
2025年8月30日Bun v1.2.21 (2025年8月25日) 引入了 Bun.SQL:一个单一的、零依赖的 SQL 客户端,支持 MySQL/MariaDB (Zig 驱动)、PostgreSQL 和 SQLite,提供一致的标签模板 API。
pnpm 10.12 (v10.12.1) 添加了一个实验性的全局虚拟存储,用于近乎即时的本地安装
2025年8月29日pnpm 10.12 引入了一个中央的、图哈希的虚拟存储,允许多个项目重用精确的依赖图,显著加快了在温暖缓存上的本地安装速度,并改善了单体仓库的工作流程。