LLM LLM上下文压缩的3个策略 每次 LLM 调用都是一场与硬限制的谈判。GPT-4o 给你 128K token。Claude 3.7 给你 200K。Gemini 1.5 Pro 扩展到 1M……
LLM 大语言模型维基模式 如果你一直对 RAG 感到沮丧,如果你觉得你的人工智能工具在对话结束的那一刻就忘记了一切,如果你因为维护太繁重而放弃了 Notion 数据库和 Obsidian 保险库;Karpathy 刚刚给了你让大语言模型做维护的蓝图。