您当前位置:首页 > 攻略 > 详情

NeurIPS 2025上NVIDIA发布了开源的自动驾驶推理模型

发布时间:2025-12-03 16:08:04作者:LSY

在NeurIPS 2025大会上,NVIDIA发布了一套全新的开放模型、数据集与工具,覆盖自动驾驶、语音人工智能及安全研究等领域,进一步巩固了其在开放数字与实体人工智能开发领域的地位。

公司还获得了Artificial Analysis新推出的开放指数的认可,该指数把NVIDIA的Nemotron系列评定为最透明的模型生态系统之一。

NVIDIA 发布了 DRIVE Alpamayo-R1,公司称其为“全球首个用于自动驾驶的开放推理 VLA 模型”。

NVIDIA应用深度学习研究副总裁Bryan Catanzaro表示,该模型将思维链推理与路径规划相结合,支持复杂道路场景和四级自主性的研究。

据英伟达介绍,AR1 会逐步拆解场景,考虑可能的轨迹,并利用上下文数据确定路线。其部分训练数据可通过NVIDIA的Physical AI Open Datasets获取,模型也可在GitHub和Hugging Face访问。

AR1基于NVIDIA Cosmos Reason,可定制用于非商业研究。NVIDIA表示,强化学习在模型后训练中非常有效,提升了其推理性能,相较于预训练版本。公司还发布了AlpaSim,一个用于评估AR1的开放框架。

此外,NVIDIA 在《宇宙手册》中通过新工具和工作流程扩展了 Cosmos 生态系统,为模型后训练、合成数据生成和评估提供了逐步指导。

基于Cosmos的新系统包括LidarGen,一个用于生成激光雷达数据的世界模型;Omniverse NuRec Fixer,用于纠正神经重建中的伪影;Cosmos政策将视频模型转化为机器人政策;以及ProtoMotions3,一个用于训练物理模拟数字人和机器人的框架。

行业合作伙伴,包括Voxel51、1X、Figure AI、Foretellix、Gatik、Oxa、PlusAI和X-Humanoid,正在使用Cosmos世界基础模型。苏黎世联邦理工学院的研究人员展示了NeurIPS的研究,展示了Cosmos模型如何生成连贯的三维场景。

在数字人工智能领域,NVIDIA推出了Nemotron和NeMo旗下的新模型和数据集。其中包括MultiTalker Parakeet,一种用于多说话环境的语音识别模型;Sortformer,一种日历模型;以及Nemotron内容安全推理,该公司表示该推理应用了领域特定的安全规则。

NVIDIA还开放了Nemotron内容安全音频数据集,用于检测不安全音频内容。还发布了合成数据和强化学习工具,包括用于强化学习环境的NeMo Gym和NeMo数据设计器库,后者现已在Apache 2.0下开源。

CrowdStrike、Palantir以及ServiceNow等合作伙伴,正借助Nemotron与NeMo工具来开展专门的代理人工智能相关工作。

热门游戏
相关攻略
热门合集推荐
小巷子里的秘密游戏 塞雷卡2 小熊猫辅助器版本 荒野大镖客手游 日式RPG汉化直装游戏 Steam移植版游戏合集 纯净漫画免费版软件大全 开罗游戏中文版大全