从算力到电力,谷歌/微软/Meta布局清洁能源,中国企业背靠国家电网优势

1 月 4 日
阅读 5 分钟
153
在美国中西部腹地,爱荷华州连绵起伏的玉米田上,巨大的白色风车不知疲倦地转动着,地面下新铺设的输电线路通向数公里外一座同样昼夜不休的建筑内,这里不生产钢铁、不加工食物,也不制造汽车,却持续吞噬着巨量电力——因为在服务器机柜之间,大量高性能 GPU 正在并行运转。
封面图

从算力到电力,谷歌/微软/Meta 布局清洁能源,中国企业背靠国家电网优势

1 月 4 日
阅读 5 分钟
107
在美国中西部腹地,爱荷华州连绵起伏的玉米田上,巨大的白色风车不知疲倦地转动着,地面下新铺设的输电线路通向数公里外一座同样昼夜不休的建筑内,这里不生产钢铁、不加工食物,也不制造汽车,却持续吞噬着巨量电力——因为在服务器机柜之间,大量高性能 GPU 正在并行运转。
封面图

【vLLM 学习】Reproduciblity

2025年12月30日
阅读 1 分钟
456
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →[链接]*在线运行 vLLM 入门教程:零基础分步指南源码 examples/offline_inference/reproduciblity.py {代码...}

【Triton 教程】triton_language.make_block_ptr

2025年12月30日
阅读 1 分钟
415
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN计算内核,并能够在现代 GPU硬件上以最大吞吐量运行。
封面图

「地质约束显式+数据驱动模型」的新路径,浙江大学团队实现跨区域矿产远景预测性能和可解释性提升

2025年12月30日
阅读 5 分钟
331
近年来,人工智能与地学数据深度融合显著推动了矿产资源预测方法的发展,矿产远景预测填图(Mineral Prospectivity Mapping, MPM)已成为降低找矿风险、支撑深部与复杂地质条件下资源勘查的重要技术手段。然而,成矿作用受构造、岩性及岩浆活动等多重地质因素控制,具有显著的空间非平稳性与方向性特征。现有多数机器学...
封面图

【TVM教程】设计与架构

2025年12月29日
阅读 7 分钟
534
TVM 现已更新到 0.21.0 版本,TVM 中文文档已经和新版本对齐。Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →Apache TVM本文档适用于想要了解 TVM 架构或积极开发项目的开发者。本文档组织结构如下:整体编译流程示例:概述 TVM 如何将一个高级模型描述...
封面图

2026 年将成中美 AI 竞赛拐点?美国监管逻辑转向背后,各巨头算力豪赌未止

2025年12月29日
阅读 5 分钟
528
如果要用关键词概括 2025 年,那么这一年无可争议地属于人工智能:当 AI 发展不再止步于技术圈内部的竞赛,而深度渗入内容生产、情感互动和公共讨论,那么它已经成为了塑造世界的真实力量。
封面图

计算成本减半,化学反应发现工具 ChemOntology 将人类直觉「编码」到系统中,加速反应路径搜索

2025年12月24日
阅读 6 分钟
905
化学反应机理不仅揭示物质转化的内在规律,也为高效催化剂设计、绿色合成路径开发等工业应用提供关键依据。而要解析反应机理,离不开一项关键的计算技术——反应路径搜索,即通过在势能面(PES)上定位局部极小值与反应中间体,帮助人们描绘出反应的真实路径。
封面图

入选 NeurIPS 2025,智源/北京大学/北京邮电大学提出多流控制视频生成框架,基于音频解混实现精确音画同步

2025年12月23日
阅读 3 分钟
1.1k
相较于文本,音频天然具备连续时间结构和丰富的动态信息,能够为视频生成提供更精细的时序控制。因此,随着视频生成模型的发展,音频驱动的视频生成也逐渐成为多模态生成领域的重要研究方向。目前,相关研究已覆盖说话人动画、音乐驱动视频以及音画同步生成等多个场景,但在复杂视频内容中,实现稳定且精确的音画对齐仍...
封面图

预测精度可提升 60%,创新神经符号回归方法可自动推导高精度网络动力学公式

2025年12月19日
阅读 3 分钟
1.4k
在复杂系统研究中,「网络」几乎无处不在——从基因调控网络、微生物群落,到人类社会中的传播网络与交通网络。然而,如何真正理解这些高维网络背后的动力学规律,始终是该领域最棘手的问题之一。
封面图

AI 论文周报丨英伟达开源模型/OpenAI 基准测试/Agent 系统/长上下文推理......AI 动态一文速递

2025年12月19日
阅读 3 分钟
1.2k
大语言模型(LLMs)在将推荐系统从隐性行为模式匹配转变为显性意图推理方面,展现出显著潜力。 RecGPT-V1 通过将基于 LLM 的推理,整合到用户兴趣挖掘和项目标签预测中,成功开创了这一范式,但它存在四个基本局限:
封面图

GPT-5 全面领先,OpenAI 发布 FrontierScience,「推理+科研」双轨检验大模型能力

2025年12月18日
阅读 4 分钟
1.1k
随着模型推理和知识能力的不断提升,更具挑战性的基准测试对于衡量和预测模型加速科学研究的能力至关重要。 2025 年 12 月 16 日,OpenAI 推出了旨在衡量专家级科学能力的基准测试 FrontierScience 。根据初步评估,GPT-5.2 在 FrontierScience-Olympiad 和 Research 任务中分别得分 25% 和 77%,领先于其他前沿模型。
封面图

坚持提前监管,离开 OpenAI 后,Dario Amodei 将 AI 安全写入公司使命

2025年12月18日
阅读 8 分钟
1.2k
在当前由算力竞赛、巨头对抗与资本加速叠加的 AI 周期中,Anthropic 联合创始人兼 CEO Dario Amodei 是硅谷极少数、却不可忽视的「逆行者」。当绝大多数科技公司将「更快迭代、更强能力」作为核心目标时,他始终坚持一个越来越难被忽视的判断:「安全性不是刹车,而是唯一能让行业继续前进的制度性护栏。」
封面图

技术沙龙|上海创智/TileAI/华为/先进编译实验室/AI9Stars 齐聚上海,深度拆解算子优化的全链路实践

2025年12月17日
阅读 4 分钟
1.2k
12 月 27 日,第 8 期 Meet AI Compiler 将在上海开讲!本期我们邀请了来自上海创智学院、 TileAI 社区、华为海思、先进编译实验室、 AI9Stars 社区的多位专家,他们将带来从软件栈设计、算子开发到性能优化的全链路分享,内容涵盖 TVM 的跨生态互操作、 PyPTO 的融合算子优化、 TileRT 的低延迟系统、 Triton 面向多架...
封面图

CUDA 初始团队成员锐评 cuTile「专打」Triton,Tile 范式能否重塑 GPU 编程生态竞争格局

2025年12月17日
阅读 5 分钟
1.4k
2025 年 12 月,在 CUDA 发布近二十年后,NVIDIA 推出了最新版 CUDA 13.1,核心变化在于全新的 CUDA Tile(简称 cuTile)编程模型,通过「Tile-based」编程模型重新组织了 GPU 的内核结构,支持开发者在不直接操作底层 CUDA C++ 的前提下,写出具备高性能特性的 Kernel 。对于 GPU 编程生态来说,这无疑是一个值得关注的...
封面图

以不足 10 万结构数据训练,瑞士洛桑联邦理工学院提出 PET-MAD,原子模拟精度媲美专业模型

2025年12月15日
阅读 6 分钟
1.4k
从半导体材料到药物活性分子,电子结构始终是理解性能的关键。第一性原理计算依托量子力学,可准确预测物质的结构、稳定性和功能,曾推动材料设计与药物研发的快速进展。但其计算量随体系规模急剧增加,即便是顶级超级计算机,也难以对蛋白质折叠、催化反应等复杂过程进行长时间尺度的模拟,造成「能表述机制,却难以算...
封面图

CPU 免费用/30 小时 GPU 额度/70GB 超大存储,HyperAI Pro 正式上线!

2025年11月26日
阅读 1 分钟
1.9k
目前,HyperAI 超神经已经为大家精选了数百个机器学习相关教程,并整理成 Jupyter Notebook 的形式,无论是初学者,亦或经验丰富的工程师,都能够便捷地体验优质开源项目,或是创建全新的模型部署。 HyperAI 超神经用稳定的算力助力 AI 项目从灵感迸发到快速落地。
封面图

百度出招!OCR 模型 PaddleOCR-VL 打破管道与端到端方法局限;面部情感识别数据集 Facial Emotion Recognition,赋能 AI 读懂表情

2025年11月25日
阅读 6 分钟
2.1k
现今文档内容的复杂性对解析技术提出了更多挑战:它们往往融合了长篇幅文本、复杂图表、专业公式、多语言等各种要素,并可能具有不规则的版面结构,因此高效、精准的文档解析已成为不可或缺的关键技术。
封面图

美团开源视频生成模型 LongCat-Video,兼具文生视频/图生视频/视频续写三大能力,媲美开闭源顶尖模型

2025年11月25日
阅读 3 分钟
1.9k
世界模型旨在理解、模拟与预测复杂的现实世界环境,是人工智能在真实场景中实现有效应用的重要基础。在这一框架中,视频生成模型通过其生成过程,逐步压缩并学习几何、语义、物理等多种知识形态,因而被视为构建世界模型的一条关键路径,并有望最终实现对真实物理世界动态的有效模拟与预测。而在视频生成领域,实现高效...
封面图

AI 论文周报丨 Attention 机制/英伟达 VLA 模型/TTS 模型/图神经网络......一文了解 AI 最新进展

2025年11月25日
阅读 3 分钟
1.3k
视觉语言模型(VLMs)与视觉语言架构(VLAs)已在自动驾驶领域得到广泛应用。然而,现有方法大多存在明显局限:或是缺乏显式的推理机制,或是以自由、非结构化的方式进行推理,导致模型难以泛化到训练数据分布之外。
封面图

活动回顾丨 北京大学/清华大学/Zilliz/MoonBit 共话开源,覆盖视频生成/视觉理解/向量数据库/AI 原生编程语言

2025年11月25日
阅读 4 分钟
1.4k
当下,AI 产业正迎来一个前所未有的发展周期。大模型的规模化应用、 AI 原生软件体系的重构、多模态基础模型的加速演进,让学界与产业界的边界变得愈发模糊。无论是视频生成对音画同步的精细化要求、终端侧视觉模型的高效推理优化,还是新一代 AI 原生编程语言的出现,都在推动一个清晰的趋势——产研协同与开源生态,正在...
封面图

卡内基跨学科团队利用随机森林模型,基于 406 份样本成功捕捉 33 亿年前生命遗迹

2025年11月24日
阅读 6 分钟
1.3k
解码深埋于地表之下的古老岩层里的有机分子,对于掌握地球历史与研究生命演进具有至关重要的作用。这些生命活动的潜在见证者不仅能够破解地球生命诞生的谜题,尤其是厘清光合作用的起源和地球大气氧化进程的关联,还能填补生命演进时间线的空白,为理解早期地球生态系统的形成提供核心线索。然而,由于这些「见证者」不...
封面图

在线教程丨 30 毫秒处理 100 个检测对象,SAM 3 实现可提示概念分割,性能提升 2 倍

2025年11月24日
阅读 3 分钟
1.4k
在视觉场景中识别并分割任意物体的能力,是多模态人工智能的重要基础,可广泛应用于机器人、内容创作、增强现实、数据标注等领域。 SAM(Segment Anything Model)是 Meta 于 2023 年 4 月发布的人工智能通用模型,提出了针对图像和视频的可提示分割任务,主要支持基于点、框或掩码的提示来分割单个目标。
封面图

200 亿美元豪赌!xAI 单押马斯克巨注叫板 OpenAI,未来商业续航成最大问号

2025年11月24日
阅读 7 分钟
1.5k
2025 年 10 月,多家媒体援引投行消息称,马斯克旗下的 xAI 正在推进一笔规模约 200 亿美元的新融资,或将跻身全球融资规模最大的 AI 初创公司之一。知情人士透露,该轮融资包含约 125 亿美元的结构化债务,并与 NVIDIA 产品采购协议绑定,意味着 xAI 将以未来算力交付与长期供货为抵押,锁定芯片的获取优先级。
封面图

10 亿用户目标仅达 2%,Sam Altman 押注的人类身份验证基础设施遭遇全球监管困局

2025年11月24日
阅读 4 分钟
1.5k
Sam Altman 与 Alex Blania 在创立 Tools for Humanity 时,怀揣着一个宏大的使命:在 AI 真假难辨的时代,为人类建立一个可靠的数字身份基石。然而,这条保障「人类中心地位」的朝圣之路,正因其独特的运作方式,在全球范围内遭遇监管的铜墙铁壁。
封面图

斯坦福/北大/UCL/UC 伯克利联手,利用 CNN 从 81 万类星体中精准识别 7 个罕见透镜样本

2025年11月24日
阅读 6 分钟
1.5k
爱因斯坦在 1915 年提出的广义相对论石破天惊地指出,质量不仅能产生引力,还会弯曲其周围的时空,光线和物质的运动都遵循着弯曲的时空路径。因此,大质量天体就像一个天然的透镜,能够使附近经过的光线发生偏折。
封面图

输入输出双侧革新!腾讯混元推出 HunyuanWorld-Mirror 刷新 3D 重建 SOTA; 解码 Netflix 内容全貌!Netflix 电影电视目录数据集助力洞察娱乐趋势

2025年11月24日
阅读 7 分钟
2.5k
视觉几何学习是计算机视觉领域的核心课题,广泛应用于增强现实、机器人操控与自主导航等场景。传统方法如运动结构重建(SfM)与多视图立体技术通常依赖迭代优化,计算代价高昂。近年来,该领域逐渐转向基于前馈神经网络的端到端几何重建模型。
封面图

重塑无序蛋白集合预测能力,英伟达/MIT/牛津大学/哥本哈根大学/Peptone 等发布生成式模型及新评测基准

2025年11月24日
阅读 6 分钟
1.8k
在结构生物学的发展历史中,「结构决定功能」一度被视为近乎不可动摇的基本法则。无论是胰岛素的经典螺旋构象,还是血红蛋白的四聚体架构,都强化了一个共识:蛋白质要发挥生物学作用,必须拥有稳定的三维结构。
封面图

AI 论文周报丨从头蛋白质设计/首个开源 Agent 方案/HunyuanOCR/Olmo 3 语言模型......一键速览

2025年11月24日
阅读 3 分钟
1.8k
多模态大语言模型(MLLM)在实现类人交互方面潜力巨大,但其发展正面临一个关键挑战:缺乏一个面向以人为中心场景的细粒度评估框架,该框架需能同时衡量模型对复杂人类意图的理解能力和提供富有同情心、上下文感知反馈的能力。
封面图

NeurIPS 2025 最佳论文奖公布!Qwen 团队/清华大学/斯坦福等联合研究成果入选

2025年11月24日
阅读 5 分钟
1.9k
NeurIPS 2025 的最佳论文奖和亚军论文奖授予了 7 篇具有突破性的论文,包括 4 篇最佳论文(其中一篇来自数据集和基准测试领域)和 3 篇亚军论文。
封面图

AltStyle によって変換されたページ (->オリジナル) /