Taalas:智能的硅变时刻
数十年来,我们将智能视为软件。一种你加载到硬件中、运行、更新、修补、替换的东西。塔拉斯 (Taalas) 架构提出了一个根本不同的想法。智能可以被制造到硬件本身中。
模型并不运行在芯片上。
模型就是芯片。
这起初听起来像是半导体领域的某种小把戏。但实际上并非如此。这是计算进化中的一次相变。
1、当知识不再是软件时
想一想音乐曾经是如何存在的。
首先它是现场表演。你必须在房间里。
然后出现了录音。音乐变成了一种你可以随处播放的文件。
然后出现了流媒体。音乐变成了一种服务。
现在想象一条不同的路径。想象如果歌曲可以嵌入到物质本身中。一张没有电子设备的乙烯基唱片,其中包含音乐。让它运动,声音直接从它的沟槽中产生。
这就是硬连接 AI 的样子。
- 传统 AI:从内存加载权重到计算单元。
- 硬连接 AI:权重物理上存在于计算结构内部。
没有加载。没有获取。没有带宽瓶颈。
知识已经在那里了。
它不是被存储。它是被体现。
2、为什么这如此重要
大多数人假设 AI 进步是关于更好的模型。
实际上,部署瓶颈主导着现实世界。
在各个行业中,相同的约束不断重复:
- 功耗预算太高
- 硬件太昂贵
- 延迟太慢
- 基础设施太复杂
这些约束并非学术性的。它们决定了 AI 是否能走出实验室。
将模型硬连接到硅中可以同时攻击这四个瓶颈。
当权重存在于内存中时,推理由数据移动主导。
当权重存在于硅中时,推理变成纯粹的计算流。
这就像以下两者的区别:
- 每次做饭时从存储器中获取食材
- 食谱被烘焙到厨房本身中
一个是灵活的。
另一个是根本高效的。
而效率是将技术变成基础设施的东西。
3、我们不断重复的历史模式
每次主要的计算浪潮都遵循相同的弧线。
早期阶段:通用硬件主导,因为工作负载变化很快。
成熟阶段:专用硅接管稳定的高容量任务。
例子随处可见:
- CPU 以前处理网络数据包。现在 ASIC 负责。
- CPU 以前解码视频。现在专用引擎负责。
- GPU 以前挖掘加密货币。然后 ASIC 挖掘机取代了它们。
AI 推理正朝向同样的目的地发展。
训练需要灵活性永远存在。
推理想要稳定性和成本崩溃。
而推理是 AI 实际上接触世界的地方。
4、大多数 AI 讨论错过的关键洞察
人们假设模型变化太快,不适合固定硬件。
这在研究中是正确的。
但在生产中是错误的。
在实际部署中,模型会长期冻结。
医院不会每周更换诊断模型。
银行不会每月轮换欺诈模型。
航空系统不会在中途更新。
评估、验证、合规和集成主导时间表。
在实践中,生产模型通常保持不变一年或更长时间。
这个稳定窗口正是硬连接硅所利用的。
如果模型稳定 12 个月,一个为该模型优化的芯片变得极其有价值。
因为经济学发生了根本变化。
5、从运行智能到制造智能
这里最深刻的概念转变是物质化。
- 软件时代:智能是符号化和流动的。
- AI 时代:智能变成统计性的。
- 硬连接时代:智能变成物质的。
这类似于数学如何变成电子学。
布尔逻辑开始是抽象推理。
然后晶体管在物理上体现了逻辑。
现在逻辑字面上被蚀刻到硅中。
硬连接 AI 对学习到的表示做了同样的事情。
神经网络变成电路拓扑。
权重变成晶体管配置。
推理变成固定结构中的信号传播。
在那时,智能不是被执行。
它是被实例化的。
6、为什么速度和成本收益如此之大
大多数现代 AI 芯片花费大量能量将权重从内存移动到计算。
内存移动主导功耗和延迟。
硬连接模型完全消除了这一点。
没有 DRAM 获取。
没有缓存层次结构开销。
没有权重流。
信号通过代表学习参数的固定计算路径流动。
这比可编程处理器更接近模拟流水线。
它类似于:
- 摄像头传感器将光直接转换为图像
- 嵌入硬件中的 DSP 滤波器
- 生物学中的神经网络视网膜
计算变成结构性的而不是程序性的。
而结构比程序更有效地扩展。
7、边缘是变得明显的地方
在数据中心,GPU 仍然有效。
在边缘,它们往往无法满足约束。
考虑 AI 最重要的环境:
- 医疗设备
- 工业机器人
- 自主无人机
- 卫星
- 防御系统
- 工厂检测
- 车辆自主性
共同要求:
- 低功耗
- 低热量
- 确定性延迟
- 无连接依赖
- 长部署周期
这些正是硬连接推理大放异彩的条件。
不可变性变成可靠性。
一个无法改变的芯片比一个可以改变的芯片更安全。
8、真正的未来应用
8.1 实时医疗诊断
想象一个超声探头,其中诊断模型被蚀刻到硅中。
没有云端。
没有延迟。
没有 GPU。
扫描时即时分类。
农村诊所无需基础设施即可获得专家级分析。
模型被认证一次。
硬件永远保证行为。
8.2 线速工业视觉
工厂通常以每分钟数千个产品的速度检查产品。
今天,GPU 推理可能会限制吞吐量。
硬连接视觉模型可以以传感器速度运行。
零缓冲的在线检测。
检测变成摄像头系统的物理属性。
8.3 自主群体机器人
小型无人机无法携带 GPU。
但它们需要在本地进行感知和推理。
硬连接模型允许:
- 低功耗飞行 AI
- 本地导航
- 协作群体协调
认知成为无人机电子设备的属性。
不是远程服务。
8.4 卫星智能
卫星一旦发射就很难更新。
硬连接推理是理想的:
- 抗辐射
- 确定性
- 能效高
- 不可变
嵌入轨道硬件中的地球观测模型。
无需下链的实时分类。
8.5 带有嵌入式认知的消费设备
手机和可穿戴设备已经包含 AI 加速器。
硬连接模型可以更进一步:
- 无电池消耗的始终开启助手
- 眼镜中的视觉理解
- 耳机中的上下文推理
个人 AI 物理上集成到设备中。
不依赖云端。
9、经济后果
如果推理成本崩溃,AI 将无处不在。
这以前在计算中发生过。
当 CPU 变得便宜时,软件爆炸了。
当 GPU 变得便宜时,图形爆炸了。
当传感器变便宜时,移动计算爆炸了。
如果 AI 推理变成硬件便宜,认知将扩散到每个系统中。
AI 不再是服务层。
它变成默认能力。
10、为什么这不会取代 GPU
灵活性仍然很重要。
训练仍然是动态的。
研究仍然是流动的。
模型仍然在进化。
通用加速器在这些阶段占主导地位。
硬连接 AI 目标相反的极端:
- 稳定
- 高容量
- 延迟关键
- 成本敏感
这是增加性的,而不是替代性的。
这与今天 CPU 和 ASIC 之间的关系相同。
11、更深刻的含义
所有这一切背后有一个哲学转变。
我们正从可编程智能向体现智能转变。
大脑不是可编程处理器。
它们是物理网络,由学习塑造。
硬连接 AI 回应了这种生物学模式。
学习塑造结构。
结构产生行为。
一旦学习完成,结构保持不变。
这正是将训练好的模型铸入硅中所做的。
12、相变时刻
技术采用很少在实时中感觉是戏剧性的。
它感觉像工程优化。
直到突然一切改变架构。
电机取代了蒸汽。
集成电路取代了分立电子元件。
闪存取代了旋转磁盘。
每一项起初看起来都是增量式的。
硬连接 AI 可能是另一个这样的时刻。
不是新模型。
不是新基准。
智能本身的新的基底。
13、当智能变成基础设施
最重要的技术消失在背景中。
- 电力
- 网络
- 存储
它们不再成为特性,而是成为假设。
硬连接 AI 指向认知的这种未来。
当智能可以廉价且可靠地制造到硬件中时,它无处不在地传播。
物体不再是被动的工具。
它们变成感知系统。
在那时,AI 不再是你部署的软件。
它是你构建使用的材料。
原文链接: Taalas: The Moment Intelligence Became a Material
汇智网翻译整理,转载请标明出处