YOLO26:支持文本提示分割

Ultralytics YOLO26 代表了现代计算机视觉的一个重大飞跃,自YOLOv5发布以来,他们已成为计算机视觉的参考公司。2023年,随着YOLOv8的发布,一个名为ultralytics的新框架与此模型一起出现。

现在他们引入了YOLO26(数字现在来自发布年份),并使用提到的ultralytics包,您获得了一个单一的统一框架,可以执行对象检测实例分割姿势估计图像分类定向边界框(OBB),甚至可以使用自然语言提示分割对象

1、Ultralytics YOLO26:游戏改变者

YOLO26将多个计算机视觉任务整合到一个生态系统中:

  • 对象检测(边界框)
  • 实例分割(像素级精度)
  • 姿势估计(人体关键点)
  • 图像分类
  • 定向边界框(OBB)用于航空和卫星图像
  • 使用YOLO-E的文本提示分割

👉 在这里探索官方文档

YOLO26:计算机视觉的新state-of-the-art模型

所有这些都作为 开源软件(AGPL)提供,可以在本地、本地或通过官方Ultralytics平台使用。

2、模型大小和部署场景

与之前的Ultralytics版本一样,YOLO26 为每个任务提供五种模型大小:

  • Nano (n) — 超轻量级模型,用于移动和低功耗设备
  • Small (s) — 针对实时边缘推理优化
  • Medium (m) — 平衡准确性和性能
  • Large (l) — 高准确性,用于 demanding 应用
  • Extra-Large (x) — 最大精度,用于研究和企业工作负载

这种灵活性允许我们在以下设备上部署YOLO26

  • 移动设备
  • NVIDIA Jetson平台
  • 边缘加速器
  • 云GPU
  • 高性能本地服务器

3、开始使用Ultralytics YOLO26 🛠️

要在本地使用YOLO26,我建议使用Python虚拟环境并安装最新的Ultralytics包,按照官方Ultralytics文档

pip install --upgrade ultralytics

官方Ultralytics文档提供了安装、训练、推理和部署的完整指导,您可以在这里访问

从文档中,您可以使用Python代码简单的CLI命令运行推理,使YOLO26对研究人员和生产工程师都可访问。

4、对象检测📹

对象检测仍然是计算机视觉中最广泛使用的任务之一。使用YOLO26,检测快速、准确且易于集成。

Python 🐍

from ultralytics import YOLO

# Load a pretrained YOLO26 detection model
model = YOLO("yolo26x.pt")

# Run from different sources
results = model(source=0, show=True, half=True) # predict on your webcam
results = model(source="video.mp4", show=True, half=True) # predict on video
results = model(source="rtsp://user:password@ipcamera:portcamera", show=True, half=True) # predict on rtsp camera
results = model(source="image.jpg", show=True, half=True) # predict on image

CLI 🤓

yolo predict detect source=0 show=True half=True model=yolo26x.pt

常见企业用例:

  • 智慧城市(交通和行人分析)
  • 农业(作物和牲畜监测)
  • 零售分析
  • 安全和监控

5、实例分割:像素级精度 ✂️

分割通过在像素级别识别每个对象来进一步推进检测。YOLO26分割模型适用于需要极高精度的应用。

Python 🐍

from ultralytics import YOLO 

# Load a pretrained YOLO26 segmentation model 
model = YOLO("yolo26x-seg.pt") 

# Run real-time segmentation from webcam 
results = model(source=2, show=True, half=True, retina_masks=True)

CLI 🤓

yolo predict segment source=2 show=True half=True retina_masks=True model=yolo26x-seg.pt

应用包括:

  • 牲畜计数
  • 医学成像支持
  • 房地产和室内分析
  • 工业检查

6、姿势估计 💃

姿势估计模型检测人体关键点,如手臂、腿部、面部和躯干。YOLO26姿势估计启用详细的人体运动分析。

Python 🐍

from ultralytics import YOLO

# Load a pretrained YOLO26 pose estimation model
model = YOLO("yolo26x-pose.pt")

# Run real-time pose estimation from webcam
results = model(source=2, show=True, half=True)

CLI 🤓

yolo predict pose source=2 show=True half=True model=yolo26x-pose.pt

用例:

  • 体育和健身分析
  • 工作场所安全
  • 人类行为分析
  • 社交媒体和内容创作

7、航空视觉的定向边界框(OBB) 📦

YOLO26 包括OBB模型,专为航空和卫星图像设计,其中对象经常旋转。

Python 🐍

from ultralytics import YOLO

# Load a pretrained YOLO26 pose estimation model
model = YOLO("yolo26x-pose.pt")

# Run real-time pose estimation from webcam
results = model(source=2, show=True, half=True)

CLI 🤓

yolo predict obb model=yolo26x-obb.pt source=aerial.mp4 show=True

这一能力对以下至关重要:

  • 卫星图像分析
  • 城市规划
  • 海事和港口监控
  • 防御和地理空间情报

8、YOLO-E:文本提示分割 🤯

YOLO26中最创新的功能之一是YOLOE,它允许使用自然语言提示进行分割。

CLI 🤓

yolo predict model=yoloe-26x-seg.pt source=video_examples/yoloe/5206818-hd_1920_1080_25fps.mp4 show=True half=True retina_masks=True classes="brown horse" conf=0.4

使用像 "brown horse""white horse" 这样的简单文本提示,YOLO-E仅选择性地分割您请求的对象。对于其他模态,请查看Ultralytics文档

这对于以下非常强大:

  • 数据集预标注
  • 快速数据集创建
  • 半自动标注工作流程

9、结束语 🎯

YOLO26 标志着可访问、生产就绪计算机视觉的一个重要里程碑。通过将对象检测、实例分割、姿势估计、OBB和文本提示分割整合到一个单一的统一框架中,YOLO26消除了管理多个工具和模型的复杂性,因此您可以在移动设备、边缘加速器或云GPU集群上使用这些模型。

对于研究人员和业余爱好者,YOLO26提供了一个简单入口点,具有简单的CLI命令和直观的Python API。对于企业,它代表了一个战略优势,能够在更快、更可靠和更大规模下部署先进的AI视觉系统。


原文链接:Ultralytics YOLO26: The Most Power Complete AI Vision Model

汇智网翻译整理,转载请标明出处