Software 2.0

Curated AI & engineering insights.

如何用神经网络赢得每个交易

我将详细拆解对冲基金如何使用神经网络在交易发生前就提取优势，并分享你今天就能构建的精确实现框架。

AI 裁员将会持续，直到......

AI 裁员将会持续，直到......

但真相是：这些裁员即使不是 AI 直接替换你，即使某种程度上是 AI 洗白，它们仍然是因为 AI。

我的 LLM 优化面试笔记

以下是我为几家领先 AI 实验室面试做准备时整理的个人笔记，同时也重新复习了高效大规模模型训练的核心思想。

MLP与ReLU²激活函数的研究

MLP与ReLU²激活函数的研究

Transformer MLP层标准的norm()预处理步骤对激活函数行为有着深远的影响，我觉得这个现象足够有趣，值得记录下来。我经常看到人们在讨论激活函数时使用直线数轴f(x)的方式，这给出的直觉与激活函数接受单位球面作为输入时截然不同——而后者正是我们对输入进行归一化时发生的情况。下面展示了单个神经元在输入经过均方根归一化后的Relu MLP中的行为。为简单起见，我将缩放因子除以root(d_model)，使得输入位于单位球面上。输入由蓝色点表示。这些输入首先被归一化为相同的长度。如果输入被初始化为正态分布，那么这些点均匀地分布在d_model维球面上（顺便说一下，这引发了一个问题：为什么在使用K和Q归一化的模型中，K和Q向量使用均匀初始化而不是正态初始化——似乎这会导致不均匀的初始化）。红色箭头代表神经元输入权重的方向。高对齐度（0,1）的蓝色点有高激活值，正交的蓝色点（1,0）激活值为零。黑线代表Relu(x) = 0的阈值。神经元的行为是：对于阈值线以上的所有点，计算它们的距离。将蓝色点沿蓝色箭头方向移动this_distance*scalar的距离。在权重更新期间： MLP可以同时设置红色和蓝色向量。两个向量都固定在原点，因为模型在MLP中没有偏置项。输入只能沿单位球面移动。

如何通过构建 AI 智能体找到工作

如何通过构建 AI 智能体找到工作

我也许应该把这篇文章叫作"2026年如何真正通过构建AI Agent找到工作"，因为本文会偏向生产系统。

AK: 软件 3.0 = LLM编程

AK: 软件 3.0 = LLM编程

我最近与Stephanie Zhan在Sequoia Ascent 2026上进行了一次炉边对话，与创始人讨论AI Agent的最新变化、这对软件意味着什么，以及我如何思考下一波AI原生公司。

我用免费AI，60天打造独立生意

我用免费AI，60天打造独立生意

这篇口述文章基于与Kristin Ginn的对话，她是trnsfrmAItn——一家AI采用咨询公司——的创始人。以下内容经过编辑，以提高简洁性和清晰度。

智能体系统中的隐性技术债

模型代码在实际系统规模中只是四舍五入的误差。它周围的一切——那些无聊的东西，那些管道——才是真正的AI系统生存、失败和积累债务的地方。

Transformer：共享注意力头

Transformer：共享注意力头

本章涵盖多头注意力、多查询注意力、分组查询注意力和多头潜在注意力——现代LLM如何管理生成文本的内存成本的演进。

为你的企业构建语义发现层

嵌入、混合排名以及真正决定此类系统能否正常运行的工程决策。

Spring AI：Java开发者的福音

Spring AI：Java开发者的福音

如何在不重写整个技术栈的情况下将GenAI集成到企业Java系统中？这就是Spring AI发挥作用的地方——它充当了现代AI能力与久经考验的Spring生态系统之间的桥梁。

数据科学家/ML工程师/AI工程师

数据科学家/ML工程师/AI工程师

你可以将这些角色看作一个光谱，从最注重数据和研究到最注重产品和用户。

一位资深开发者对AI编程的看法

一位资深开发者对AI编程的看法

不是关于提示词。不是关于工具。而是关于当你停止独立思考时会发生什么。

OpenCode：智能体界的Linux

OpenCode：智能体界的Linux

让我解释一下我所说的"代理工具"是什么意思，为什么OpenCode配得上"AI代理界的Linux"这个称号，以及为什么如果你关心隐私、灵活性，或者只是不想被锁定在另一个生态系统中，这件事很重要。

$RMSNorm 背后的数学$

RMSNorm 背后的数学

RMSNorm本质上是在做一个赌注：激活向量的方向已经承载了所有有用信息，你只需要归一化幅度来保持训练稳定。

我觉得你应该试试 Codex

正如我最近写的，Cursor的20美元计划意味着你获得的第三方模型使用量非常少，这让构建东西变得困难。

4个主流AI编码代理的真正差异

4个主流AI编码代理的真正差异

四大AI编码CLI终于在相同的子智能体原语上实现了收敛——探索这将如何重塑规划、并行工作和模型无关的自动化。

从零构建智能体：只是一个循环

对我来说，理解一个新概念的最佳方式就是构建它并向别人解释。这篇文章两者兼顾。我将实验故事与实用教程结合在一起，我相信你会觉得它有用。

AI定价背后的秘密

让我通过解释现代AI中最被误解的基本组件之一，来揭示Anthropic（Claude的创造者）用来向你收取更多费用的一个把戏。

AI的蜜月期结束了，付钱吧！

有一件事是确定的。除非我们转向本地化，廉价AI的时代正在走向终结。雇佣人类可能真的又开始成为最便宜的选项了。

旋转位置编码(RoPE)简明教程

旋转位置编码(RoPE)简明教程

RoPE，即旋转位置编码，采用了一种巧妙的方法来同时融入相对和绝对位置信息。

我让AI接管了整个数据科学工作流

我让AI接管了整个数据科学工作流

使用Codex和MCP连接Google Drive、GitHub、BigQuery和分析流程。

CocoIndex：AI原生数据管道

CocoIndex：AI原生数据管道

本文深入探讨CocoIndex的架构（包括最新更新），然后演示那个激发表情包灵感的管道：一个使用Tavily搜索、GPT-4o-mini提取和PostgreSQL存储的竞争情报监控器——所有代码均来自开源仓库。

初级开发者的新定位

面向工程管理者和招聘负责人：40分钟的智能体测试对你们的学徒制人才管道意味着什么。

我的5个AI副业，结果出乎意料

我的5个AI副业，结果出乎意料

有些彻底失败了。有一个让我赚到了比兼职工作还多的钱。以下是一份诚实的总结。