LLM开发新手指南

为什么LLM开发者如此抢手,这到底需要什么,以及如何开始(而不会崩溃)的指南。

LLM开发新手指南

LLM无处不在。你的代码编辑器会建议完整的函数,你的同事用ChatGPT写邮件,而你的CEO刚刚问“我们能不能AI这个”。

感觉就像在一场没人告诉你的游戏补丁中进行。突然间,每个人都在谈论RAG管道、微调、代理工作流程,而你只是坐在那里想知道是否错过了一个扩展包。

如果你曾经构建过网页应用、移动应用或任何传统的软件,进入大型语言模型(LLM)开发可能会感觉像从FPS切换到开放世界沙盒模式。这不是关于“编写正确的代码”,而是关于“设计正确的行为”。

但事实是:这不仅仅是炒作。LLM开发正在成为科技行业最热门、高杠杆的技能之一,不只是研究人员。对于建造者。对于独立黑客。对于喜欢实验的开发者。

1、为什么LLM开发者突然变得炙手可热

首先明确一点:LLM应用程序不再是仅仅是花哨的聊天机器人。

是的,ChatGPT让所有人都进来了。但背后的是更大的东西:一种新的计算界面。一种应用程序可以理解、生成并推理语言的界面。这是一场变革,整个行业都知道。

初创公司正在基于OpenAI和Claude API推出完整的产品。开发者正在构建整个工作流程,其中LLM取代逻辑树,从混乱的数据中提取意义,甚至作为自主代理完成任务而无需逐步指令。即使是企业团队也在推出内部工具,使用LLM来简化从入职到客户支持的一切。

而且关键是:你不需要博士学位就能做到这一点。你需要不错的代码,对工具的理解,以及一些黑客精神。如果你能构建一个不错的CRUD应用,一旦你学会了如何引导它们,你就可以用LLM构建东西。

有真实的钱,真实的需求,而且仍然没有足够的开发者能够将传统软件工程与语言模型流利度结合起来。

只需查看AI Jobs等职位板,或者在Wellfound上搜索“LLM工程师”。公司需要建造者。不是理论家。

2、LLM开发与“正常”开发有何不同

用LLM构建东西就像从编写函数切换到编写咒语。

传统的开发是逻辑:ifelse、严格的输入、可预测的输出。LLM开发是氛围,概率性的,上下文感知的,并且充满了奇怪的边缘情况,甚至感觉不像边缘情况。

你不仅仅是在编写行为,你是在协调语言。这意味着你以前认为是“业务逻辑”的东西现在可能存在于提示中、用户输入的一部分或检索器的搜索结果中。调试变成了一种奇怪的测试、提示工程和自问自答的混合体:“为什么AI刚刚用俳句回应?”

一些关键区别:

  • 提示代替条件逻辑。 你仍然会写代码,但很多你的“规则”是用普通文本编写的模糊指令。
  • API是你的新工具箱。 你会使用OpenAI、Anthropic、Mistral、Groq等,每个都有其特点、令牌限制和行为不同的模型。
  • 上下文是最重要的。 你需要管理你的应用程序给模型的信息量——太少,它会困惑。太多,它会超出令牌限制。

最奇怪的部分?你并不总是得到相同的输出两次。

它不像编写纯函数,更像设计对话流程或《选择你的冒险》书,其中模型偶尔会误解指令,像一个混乱的中立地牢主一样。

但当它起作用时,它感觉神奇。

3、你实际上需要哪些技能?

快速消除这个神话:你不需要知道深度学习或微积分才能成为LLM开发者。

但你需要学习一些新工具,掌握新的思维模型,并接受提示驱动行为的混乱。

这里真正重要的内容:

核心技能:

  • Python或JavaScript。 Python仍然是首选,但JS/TypeScript正在获得势头,特别是在以网络为主的LLM工具中。
  • API,API,API。 知道如何调用OpenAI、Anthropic、Mistral、Groq、Gemini等,根据成本、速度或上下文长度在它们之间切换。
  • LangChain或LlamaIndex。 这些是构建多步骤工作流程、记忆链和代理式应用的首选编排框架。
  • 向量数据库。 Pinecone、Weaviate、Qdrant,甚至是FAISS,LLM应用通常依赖于从大型知识库中检索相关片段。

软技能比你想象的更重要:

  • 提示工程。 不,它不会消失。知道如何措辞,指导模型行为,避免提示注入是一项真正的技能。
  • 调试奇怪的现象。 “为什么我的LLM在税务计算中引用星球大战?”←这会发生,你需要工具来追踪它。
  • 理解上下文窗口。 尤其是当你分割文档、流式输入或运行长对话时。

总之:这不是关于掌握AI理论,而是关于构建与语言一起工作的应用。工具很奇怪,但最终它仍然是开发工作。

4、LLM驱动项目的实际例子

如果你认为LLM应用程序只是另一个“与PDF聊天”的克隆,那么你就错过了有趣的东西。现实中的用例正在变得疯狂且有利可图。

以下是一些LLM表现出色的例子:

  • 代理工作流程。 想象一个不仅回答问题,还能采取行动的机器人——发送电子邮件、抓取数据或根据你说的话更新工单。想想AutoGPT,但少点“哦,我花了200美元在API上”和更多专注。
  • 基于检索的问答。 公司正在使用LLM使内部文档可以用普通英语查询,为ChatDOC或内部AI助手等工具提供动力。
  • 内容增强。 从GitHub Copilot编写代码到LLM生成技术文档,这些模型正在将样板任务变成一行代码。
  • 游戏/NPC大脑。 一些开发者正在给游戏中非玩家角色一个真正的对话AI大脑,这样你的NPC任务发布者就不会听起来像一个坏了的唱片了。(请有人制作Skyrim with GPT NPCs,我们恳求。)

5、如何开始(而不会崩溃)

学习LLM开发的最糟糕方式?看40小时的YouTube视频但从不构建任何东西。

LLM是奇怪、混乱和不可预测的。唯一变好的方法是开始发布小东西,即使它们崩溃、幻觉或听起来像莎士比亚头受伤了。

这是你的低摩擦入门套件:

5.1获取API访问权限

  • OpenAI、Claude或Groq开始。创建一个免费账户并测试几个提示。
  • 额外:尝试使用llama.cpp或Ollama在本地运行开源模型。

5.2 使用低代码工具进行原型设计

  • Flowise:一个可视化的LangChain UI,允许你通过拖放节点构建链条。
  • Dust.tt:非常适合创建类似GPT的代理,具有结构化记忆和工具。
  • LangChain Templates:聊天机器人、RAG应用和代理的现成启动仓库。

5.3 构建一个小作品集

进行“5周内完成5个LLM应用”的挑战。想法:

  • AI电子邮件摘要器
  • 与你的Notion文档交谈的聊天机器人
  • 基于LLM的DnD NPC生成器
  • 启动想法验证机器人
  • 针对开发工作的简历修复器

通过调试一个粗糙的项目,你会学到更多,而不是10个教程。

5.4 TL;DR 这适合你吗?

如果你厌倦了CRUD应用,厌倦了像素推的前端框架,或者只是想构建一些感觉活着的东西,那么LLM开发在召唤你。

你不需要成为AI巫师。你不需要训练自己的模型。你只需要:

  • 知道如何编码(一点点)
  • 学习如何与模型交流(提示得当)
  • 接受不可预测性(更聪明地调试)

这个领域还很年轻、混乱且开放。现在跳入的开发者?一年后别人会称他们为“AI工程师”,即使他们是从一个基本的Python脚本和周末的想法开始的。

如果你喜欢摆弄东西,如果你喜欢奇怪的bug,如果你喜欢制造让人惊叹的东西,那么是的,你是为这个而生的。

6、快速入门资源

想要快速构建LLM应用?从这里开始:


原文链接:So… you wanna build with LLMs?

汇智网翻译整理,转载请标明出处