MODEL-ZOO MiniMax M3 M3 与 GPT-5.5 和 Gemini 3.1 Pro 相比非常有竞争力,它使用 MiniMax Sparse Attention (MSA) 让长上下文变得实用。
MODEL-ZOO LocateAnything-3B:再见YOLO! 今天的大多数图像模型非常擅长描述图像。它们可以告诉你发生了什么。但LocateAnything专注于不同的方向:"它到底在哪里?"。
MODEL-ZOO VoxCPM2 多语种开源TTS模型 30种语言,48kHz输出,上下文感知的韵律。从文本设计任何声音。从短音频片段克隆并带有风格引导。无需语言标签。一切都在本地运行。免费用于商业用途。
MODEL-ZOO DeepSeek v4实测:CC & Hermes 我本以为只是炒作,所以我用 Claude Code 和 Hermes Agent 都测试了一下,结果发现我错了,现在给它起了个绰号——我的"一次通过之王"
MODEL-ZOO OpenMythos:Mythos开源复现 OpenMythos基于第一性原理对 Claude Mythos 架构进行理论复现,完全使用 PyTorch 构建,并以同行评审研究为基础。
MODEL-ZOO 15个实测:Kimi K2.6 vs. GLM-5.1 两个中国开源模型目前占据全球 SWE-Bench Pro 排行榜榜首:Kimi K2.6 为 58.6%,GLM-5.1 为 58.4%。从纸面上看它们打平了。我花了 18 小时让两个模型通过相同的 15 个生产编程任务。结果发现 0.2 分的差距是整个对比中最小的差距。
MODEL-ZOO Gemini 3.1 TTS提示编写指南 Gemini 3.1 Flash 文本转语音 (TTS) 是一个新模型,你可以通过指导它来获得精确的音频表现。在这篇博文中,我将分享一些关于如何通过提示词引导模型的技巧,并展示它的一些优势。