YOLO26:支持文本提示分割
Ultralytics的新SOTA模型,可以执行对象检测、实例分割、姿势估计、图像分类和定向边界框(OBB),甚至可以使用自然语言提示分割对象。
Ultralytics YOLO26 代表了现代计算机视觉的一个重大飞跃,自YOLOv5发布以来,他们已成为计算机视觉的参考公司。2023年,随着YOLOv8的发布,一个名为ultralytics的新框架与此模型一起出现。
现在他们引入了YOLO26(数字现在来自发布年份),并使用提到的ultralytics包,您获得了一个单一的统一框架,可以执行对象检测、实例分割、姿势估计、图像分类和定向边界框(OBB),甚至可以使用自然语言提示分割对象。
1、Ultralytics YOLO26:游戏改变者
YOLO26将多个计算机视觉任务整合到一个生态系统中:
- 对象检测(边界框)
- 实例分割(像素级精度)
- 姿势估计(人体关键点)
- 图像分类
- 定向边界框(OBB)用于航空和卫星图像
- 使用YOLO-E的文本提示分割
👉 在这里探索官方文档

所有这些都作为 开源软件(AGPL)提供,可以在本地、本地或通过官方Ultralytics平台使用。
2、模型大小和部署场景
与之前的Ultralytics版本一样,YOLO26 为每个任务提供五种模型大小:
- Nano (n) — 超轻量级模型,用于移动和低功耗设备
- Small (s) — 针对实时边缘推理优化
- Medium (m) — 平衡准确性和性能
- Large (l) — 高准确性,用于 demanding 应用
- Extra-Large (x) — 最大精度,用于研究和企业工作负载
这种灵活性允许我们在以下设备上部署YOLO26:
- 移动设备
- NVIDIA Jetson平台
- 边缘加速器
- 云GPU
- 高性能本地服务器
3、开始使用Ultralytics YOLO26 🛠️
要在本地使用YOLO26,我建议使用Python虚拟环境并安装最新的Ultralytics包,按照官方Ultralytics文档。
pip install --upgrade ultralytics
官方Ultralytics文档提供了安装、训练、推理和部署的完整指导,您可以在这里访问
从文档中,您可以使用Python代码或简单的CLI命令运行推理,使YOLO26对研究人员和生产工程师都可访问。
4、对象检测📹
对象检测仍然是计算机视觉中最广泛使用的任务之一。使用YOLO26,检测快速、准确且易于集成。
Python 🐍
from ultralytics import YOLO
# Load a pretrained YOLO26 detection model
model = YOLO("yolo26x.pt")
# Run from different sources
results = model(source=0, show=True, half=True) # predict on your webcam
results = model(source="video.mp4", show=True, half=True) # predict on video
results = model(source="rtsp://user:password@ipcamera:portcamera", show=True, half=True) # predict on rtsp camera
results = model(source="image.jpg", show=True, half=True) # predict on image
CLI 🤓
yolo predict detect source=0 show=True half=True model=yolo26x.pt
常见企业用例:
- 智慧城市(交通和行人分析)
- 农业(作物和牲畜监测)
- 零售分析
- 安全和监控

5、实例分割:像素级精度 ✂️
分割通过在像素级别识别每个对象来进一步推进检测。YOLO26分割模型适用于需要极高精度的应用。
Python 🐍
from ultralytics import YOLO
# Load a pretrained YOLO26 segmentation model
model = YOLO("yolo26x-seg.pt")
# Run real-time segmentation from webcam
results = model(source=2, show=True, half=True, retina_masks=True)
CLI 🤓
yolo predict segment source=2 show=True half=True retina_masks=True model=yolo26x-seg.pt
应用包括:
- 牲畜计数
- 医学成像支持
- 房地产和室内分析
- 工业检查

6、姿势估计 💃
姿势估计模型检测人体关键点,如手臂、腿部、面部和躯干。YOLO26姿势估计启用详细的人体运动分析。
Python 🐍
from ultralytics import YOLO
# Load a pretrained YOLO26 pose estimation model
model = YOLO("yolo26x-pose.pt")
# Run real-time pose estimation from webcam
results = model(source=2, show=True, half=True)
CLI 🤓
yolo predict pose source=2 show=True half=True model=yolo26x-pose.pt
用例:
- 体育和健身分析
- 工作场所安全
- 人类行为分析
- 社交媒体和内容创作

7、航空视觉的定向边界框(OBB) 📦
YOLO26 包括OBB模型,专为航空和卫星图像设计,其中对象经常旋转。
Python 🐍
from ultralytics import YOLO
# Load a pretrained YOLO26 pose estimation model
model = YOLO("yolo26x-pose.pt")
# Run real-time pose estimation from webcam
results = model(source=2, show=True, half=True)
CLI 🤓
yolo predict obb model=yolo26x-obb.pt source=aerial.mp4 show=True
这一能力对以下至关重要:
- 卫星图像分析
- 城市规划
- 海事和港口监控
- 防御和地理空间情报

8、YOLO-E:文本提示分割 🤯
YOLO26中最创新的功能之一是YOLOE,它允许使用自然语言提示进行分割。
CLI 🤓
yolo predict model=yoloe-26x-seg.pt source=video_examples/yoloe/5206818-hd_1920_1080_25fps.mp4 show=True half=True retina_masks=True classes="brown horse" conf=0.4
使用像 "brown horse"或"white horse" 这样的简单文本提示,YOLO-E仅选择性地分割您请求的对象。对于其他模态,请查看Ultralytics文档
这对于以下非常强大:
- 数据集预标注
- 快速数据集创建
- 半自动标注工作流程

9、结束语 🎯
YOLO26 标志着可访问、生产就绪计算机视觉的一个重要里程碑。通过将对象检测、实例分割、姿势估计、OBB和文本提示分割整合到一个单一的统一框架中,YOLO26消除了管理多个工具和模型的复杂性,因此您可以在移动设备、边缘加速器或云GPU集群上使用这些模型。
对于研究人员和业余爱好者,YOLO26提供了一个简单入口点,具有简单的CLI命令和直观的Python API。对于企业,它代表了一个战略优势,能够在更快、更可靠和更大规模下部署先进的AI视觉系统。
原文链接:Ultralytics YOLO26: The Most Power Complete AI Vision Model
汇智网翻译整理,转载请标明出处