TOOL Google ADK 可视化AI代理构建器 Google ADK v1.18.0 引入了可视化AI代理构建器——一个基于浏览器的界面,让您可以通过拖放交互和自然语言对话来设计、配置和测试复杂的多代理系统。
LIBRARY RAG神器:Gemini文件搜索工具 Google在 Gemini API 中悄然推出了一款全新的文件搜索工具,它可以帮您处理所有繁重的 RAG 工作。您只需上传文件,提出问题,剩下的就交给它来搞定。
APPLICATION 用 LangGraph 构建 AI 交易代理 我想分享一个我特别兴奋的项目:一个自动化的金融交易代理。它是一个有状态的、自我指导的代理,能够推理目标、执行一系列金融分析步骤,并决定何时完成工作。
APPLICATION Qwen-image-edit 本地部署实践 我们尝试在搭载 AMD Ryzen AI Max+395 和 Intel Core Ultra 125H 的 AI PC 上本地运行 Qwen-Image-Edit 模型,以执行典型的照片编辑任务。
MODEL-ZOO Kimi K2 Thinking Moonshot AI 的基准测试成绩,显示 K2 Thinking 在“代理推理”和“代理搜索”方面击败了顶级的 OpenAI 和 Anthropic 模型,但在“编码”方面并未达到顶尖水平。
MODEL-ZOO FIBO - Nano Banana的开源对手 作为第一个原生支持JSON的图像生成模型,FIBO为每个渲染提供了可追溯性、可审计性和精确的可编辑性,专为代理、自动化和专业设计工作流程而构建。
INDIE HACKER 上下文聚合:真正的AI战场? AI模型拥有的上下文越多,用户体验就越好。如果一家AI公司能比其他人多100倍地了解你,他们就会拥有一个深厚的护城河。一场上下文战争比一系列AI浏览器战斗更为重要。
MODEL-ZOO IBM Granite 4.0-Nano边缘AI模型 IBM推出了Granite 4.0 Nano模型系列,致力于创建强大且实用的大语言模型(LLM),这些模型特别优化用于边缘和设备端应用。
MODEL-ZOO Chandra:复杂文档OCR模型 Datalab 开发了一款名为 Chandra 的开源 OCR 模型。它在社交媒体上几乎无人问津,但在独立基准测试中,它悄然超越了所有主流 OCR 系统。
TOOL 用RTX 5090本地微调语言模型 我关注NVIDIA的Blackwell架构发布已经有一段时间了,所以当看到Unsloth也加入了对Blackwell的支持时,我决定尝试单个GPU究竟能做到什么程度。
APPLICATION 用机器学习优化照片选择 我们最近推出了主图服务,这是一个机器学习系统,可以自动选择最具吸引力的主图——即Tripadvisor上代表酒店、餐厅或景点的第一张照片,以帮助我们的合作伙伴更快地进行视觉决策。
MODEL-ZOO 本地微调 Qwen3-VL 模型 在本文中,我们将探讨 Qwen3-VL 与 Qwen2.5-VL 在架构、训练和整体性能方面的区别,介绍 GPU 要求,并逐步讲解如何使用 Unsloth进行微调。