Taalas:智能的硅变时刻

数十年来,我们将智能视为软件。一种你加载到硬件中、运行、更新、修补、替换的东西。塔拉斯 (Taalas) 架构提出了一个根本不同的想法。智能可以被制造到硬件本身中。

Taalas:智能的硅变时刻
AI编程/Vibe Coding 遇到问题需要帮助的,联系微信 ezpoda,免费咨询。

数十年来,我们将智能视为软件。一种你加载到硬件中、运行、更新、修补、替换的东西。塔拉斯 (Taalas) 架构提出了一个根本不同的想法。智能可以被制造到硬件本身中。

模型并不运行在芯片上。

模型就是芯片。

这起初听起来像是半导体领域的某种小把戏。但实际上并非如此。这是计算进化中的一次相变。

1、当知识不再是软件时

想一想音乐曾经是如何存在的。

首先它是现场表演。你必须在房间里。

然后出现了录音。音乐变成了一种你可以随处播放的文件。

然后出现了流媒体。音乐变成了一种服务。

现在想象一条不同的路径。想象如果歌曲可以嵌入到物质本身中。一张没有电子设备的乙烯基唱片,其中包含音乐。让它运动,声音直接从它的沟槽中产生。

这就是硬连接 AI 的样子。

  • 传统 AI:从内存加载权重到计算单元。
  • 硬连接 AI:权重物理上存在于计算结构内部。

没有加载。没有获取。没有带宽瓶颈。

知识已经在那里了。

它不是被存储。它是被体现。

2、为什么这如此重要

大多数人假设 AI 进步是关于更好的模型。

实际上,部署瓶颈主导着现实世界。

在各个行业中,相同的约束不断重复:

  • 功耗预算太高
  • 硬件太昂贵
  • 延迟太慢
  • 基础设施太复杂
Llama 3.1 8B 性能数据,输入序列长度 1k/1k

这些约束并非学术性的。它们决定了 AI 是否能走出实验室。

将模型硬连接到硅中可以同时攻击这四个瓶颈。

当权重存在于内存中时,推理由数据移动主导。

当权重存在于硅中时,推理变成纯粹的计算流。

这就像以下两者的区别:

  • 每次做饭时从存储器中获取食材
  • 食谱被烘焙到厨房本身中

一个是灵活的。

另一个是根本高效的。

而效率是将技术变成基础设施的东西。

3、我们不断重复的历史模式

每次主要的计算浪潮都遵循相同的弧线。

早期阶段:通用硬件主导,因为工作负载变化很快。

成熟阶段:专用硅接管稳定的高容量任务。

例子随处可见:

  • CPU 以前处理网络数据包。现在 ASIC 负责。
  • CPU 以前解码视频。现在专用引擎负责。
  • GPU 以前挖掘加密货币。然后 ASIC 挖掘机取代了它们。

AI 推理正朝向同样的目的地发展。

训练需要灵活性永远存在。

推理想要稳定性和成本崩溃。

而推理是 AI 实际上接触世界的地方。

4、大多数 AI 讨论错过的关键洞察

人们假设模型变化太快,不适合固定硬件。

这在研究中是正确的。

但在生产中是错误的。

在实际部署中,模型会长期冻结。

医院不会每周更换诊断模型。

银行不会每月轮换欺诈模型。

航空系统不会在中途更新。

评估、验证、合规和集成主导时间表。

在实践中,生产模型通常保持不变一年或更长时间。

这个稳定窗口正是硬连接硅所利用的。

如果模型稳定 12 个月,一个为该模型优化的芯片变得极其有价值。

因为经济学发生了根本变化。

5、从运行智能到制造智能

这里最深刻的概念转变是物质化。

  • 软件时代:智能是符号化和流动的。
  • AI 时代:智能变成统计性的。
  • 硬连接时代:智能变成物质的。

这类似于数学如何变成电子学。

布尔逻辑开始是抽象推理。

然后晶体管在物理上体现了逻辑。

现在逻辑字面上被蚀刻到硅中。

硬连接 AI 对学习到的表示做了同样的事情。

神经网络变成电路拓扑。

权重变成晶体管配置。

推理变成固定结构中的信号传播。

在那时,智能不是被执行。

它是被实例化的。

6、为什么速度和成本收益如此之大

大多数现代 AI 芯片花费大量能量将权重从内存移动到计算。

内存移动主导功耗和延迟。

硬连接模型完全消除了这一点。

没有 DRAM 获取。

没有缓存层次结构开销。

没有权重流。

信号通过代表学习参数的固定计算路径流动。

这比可编程处理器更接近模拟流水线。

它类似于:

  • 摄像头传感器将光直接转换为图像
  • 嵌入硬件中的 DSP 滤波器
  • 生物学中的神经网络视网膜

计算变成结构性的而不是程序性的。

而结构比程序更有效地扩展。

7、边缘是变得明显的地方

在数据中心,GPU 仍然有效。

在边缘,它们往往无法满足约束。

考虑 AI 最重要的环境:

  • 医疗设备
  • 工业机器人
  • 自主无人机
  • 卫星
  • 防御系统
  • 工厂检测
  • 车辆自主性

共同要求:

  • 低功耗
  • 低热量
  • 确定性延迟
  • 无连接依赖
  • 长部署周期

这些正是硬连接推理大放异彩的条件。

不可变性变成可靠性。

一个无法改变的芯片比一个可以改变的芯片更安全。

8、真正的未来应用

8.1 实时医疗诊断

想象一个超声探头,其中诊断模型被蚀刻到硅中。

没有云端。

没有延迟。

没有 GPU。

扫描时即时分类。

农村诊所无需基础设施即可获得专家级分析。

模型被认证一次。

硬件永远保证行为。

8.2 线速工业视觉

工厂通常以每分钟数千个产品的速度检查产品。

今天,GPU 推理可能会限制吞吐量。

硬连接视觉模型可以以传感器速度运行。

零缓冲的在线检测。

检测变成摄像头系统的物理属性。

8.3 自主群体机器人

小型无人机无法携带 GPU。

但它们需要在本地进行感知和推理。

硬连接模型允许:

  • 低功耗飞行 AI
  • 本地导航
  • 协作群体协调

认知成为无人机电子设备的属性。

不是远程服务。

8.4 卫星智能

卫星一旦发射就很难更新。

硬连接推理是理想的:

  • 抗辐射
  • 确定性
  • 能效高
  • 不可变

嵌入轨道硬件中的地球观测模型。

无需下链的实时分类。

8.5 带有嵌入式认知的消费设备

手机和可穿戴设备已经包含 AI 加速器。

硬连接模型可以更进一步:

  • 无电池消耗的始终开启助手
  • 眼镜中的视觉理解
  • 耳机中的上下文推理

个人 AI 物理上集成到设备中。

不依赖云端。

9、经济后果

如果推理成本崩溃,AI 将无处不在。

这以前在计算中发生过。

当 CPU 变得便宜时,软件爆炸了。

当 GPU 变得便宜时,图形爆炸了。

当传感器变便宜时,移动计算爆炸了。

如果 AI 推理变成硬件便宜,认知将扩散到每个系统中。

AI 不再是服务层。

它变成默认能力。

10、为什么这不会取代 GPU

灵活性仍然很重要。

训练仍然是动态的。

研究仍然是流动的。

模型仍然在进化。

通用加速器在这些阶段占主导地位。

硬连接 AI 目标相反的极端:

  • 稳定
  • 高容量
  • 延迟关键
  • 成本敏感

这是增加性的,而不是替代性的。

这与今天 CPU 和 ASIC 之间的关系相同。

11、更深刻的含义

所有这一切背后有一个哲学转变。

我们正从可编程智能向体现智能转变。

大脑不是可编程处理器。

它们是物理网络,由学习塑造。

硬连接 AI 回应了这种生物学模式。

学习塑造结构。

结构产生行为。

一旦学习完成,结构保持不变。

这正是将训练好的模型铸入硅中所做的。

12、相变时刻

技术采用很少在实时中感觉是戏剧性的。

它感觉像工程优化。

直到突然一切改变架构。

电机取代了蒸汽。

集成电路取代了分立电子元件。

闪存取代了旋转磁盘。

每一项起初看起来都是增量式的。

硬连接 AI 可能是另一个这样的时刻。

不是新模型。

不是新基准。

智能本身的新的基底。

13、当智能变成基础设施

最重要的技术消失在背景中。

  • 电力
  • 网络
  • 存储

它们不再成为特性,而是成为假设。

硬连接 AI 指向认知的这种未来。

当智能可以廉价且可靠地制造到硬件中时,它无处不在地传播。

物体不再是被动的工具。

它们变成感知系统。

在那时,AI 不再是你部署的软件。

它是你构建使用的材料。


原文链接: Taalas: The Moment Intelligence Became a Material

汇智网翻译整理,转载请标明出处