MODEL-ZOO LightOnOCR-2:1B超能OCR模型 LightOnOCR-2 是一个基于VLM的10亿参数OCR模型,它直接挑战该领域更成熟的玩家,如 OLM OCR、DeepSeek OCR 和 dots.ocr。
MODEL-ZOO 微调PHI-3以优化RAG 一个完整的、动手的指南,使用 Unsloth 在免费层级的 Google Colab 上对 Microsoft 的 3.8B 参数模型进行微调,实现 200% 的准确率提升并消除幻觉
MODEL-ZOO Luxical: CPU上的超高速文本嵌入 Luxical是一种全新的文本嵌入方法,在 CPU 上运行速度极快,完全避免了繁重的 Transformer 推理,同时在文档相似度、聚类和分类方面依然表现出色。
MODEL-ZOO SAM 3D:从单张图像抽取3D模型 Meta 的新 SAM 3D 不再仅仅了解照片中的内容。它了解事物在 3D 空间中的位置。单击照片中的咖啡杯,它会返回完整的 3D 网格。指向一个人,你就可以得到他们完整的身体姿势和形状。
MODEL-ZOO Kimi K2 Thinking Moonshot AI 的基准测试成绩,显示 K2 Thinking 在“代理推理”和“代理搜索”方面击败了顶级的 OpenAI 和 Anthropic 模型,但在“编码”方面并未达到顶尖水平。
MODEL-ZOO FIBO - Nano Banana的开源对手 作为第一个原生支持JSON的图像生成模型,FIBO为每个渲染提供了可追溯性、可审计性和精确的可编辑性,专为代理、自动化和专业设计工作流程而构建。
MODEL-ZOO IBM Granite 4.0-Nano边缘AI模型 IBM推出了Granite 4.0 Nano模型系列,致力于创建强大且实用的大语言模型(LLM),这些模型特别优化用于边缘和设备端应用。