Kling 2.5 Turbo使用教程
Pieter Levels说的没错,2025年将是AI视频生成器的一年。我们已经看到互联网是如何被Google的Veo 3所颠覆的,Veo 3现在推动了今天在社交媒体上广泛传播的病毒式AI视频。
Kling 2.5 Turbo刚刚发布,根据内部测试,它甚至在成对盲测中超越了它的两个最接近的竞争对手Veo 3 Fast和Seedance。
图像到视频的盲测结果也是一样的。
当然,像这样的基准测试应该总是带着一点怀疑来看待。数字和受控比较虽然不错,但我更喜欢亲自测试一个新模型后再得出结论。
而这正是我将在本文中做的事情。
1、Kling 2.5 Turbo的主要特点
与之前的版本相比,Kling 2.5 Turbo引入了以下主要改进:
- 更好的提示遵循和时间控制:新模型通过理解序列和因果逻辑来更有效地解释复杂提示。
- 在动态场景中更加流畅和稳定:通过强化学习和更智能的数据处理,模型产生更真实和稳定的运动。它通过模拟物理行为更好地处理具有挑战性的动态场景。
- 与各种风格的一致性:模型在整个视频帧中保留参考图像的视觉风格。它使用先进的条件和大规模训练来保持颜色、照明、纹理和氛围的一致性。
- 更低的价格更好的效果:2.5 Turbo模型现在更便宜,并且比Veo 3 Fast或Seedance 1.0等竞争对手提供了显著更好的性能。
如果你想尝试这个新模型,你可以在Kling的官方网站上进行测试。它也可以通过Pollo AI等平台获得,目前Pollo AI对视频生成积分提供50%的折扣。
现在,让我们做几个例子。
2、在Pollo AI中使用Kling 2.5 Turbo
要开始,请前往 Pollo AI 的网站并注册一个免费账户。登录后,打开视频生成工具并选择 Kling 2.5 Turbo 作为模型。
从那里,你可以配置参数,如提示、音频选项、视频长度和宽高比。
对于第一个测试,我使用的提示是:
提示:在一个阴郁的慢动作镜头中,一个模特穿着嵌有闪烁霓虹电路的半透明斗篷,走过反射地板。在深蓝色灯光和环境雾气下,电路像一个活的界面一样柔和地脉动。她的轮廓通过斗篷微微发光,仿佛悬浮在现实与模拟之间。远处的镜头光晕掠过她的脸庞,当她转身时,眼睛平静而难以捉摸。
Pollo AI还引入了一个新的 提示强度 滑块。这让你可以控制系统严格遵循你的提示的程度。
将其设置为100%会强制模型完全遵循描述,降低它则允许更多的创意变化。
这是最终视频的样子(链接):
视频做得很好。电路在模特穿过地板时透过斗篷脉动的方式看起来非常酷。让这一切更加可信的是环境声音和细微的效果——它们实际上有助于营造氛围。
我能想象这对正在制作过场动画的游戏工作室或想要快速模拟电影场景的动画师来说很有用。电影制片人也可以用它来构思想法而不必进行全面的CG制作。
3、将照片转换为视频
在下一个测试中,我想看看Kling 2.5 Turbo在图像到视频任务上的表现如何。我使用了一张滑板运动员的照片:
你可以描述输出视频应该是什么样子,但你也可以留空,让Kling 2.5 Turbo决定。
提示:一个男孩骑着滑板沿着空荡荡的街道滑行,轻松地做出流畅的技巧动作。他的动作自信而干净,随着速度加快,然后滑向远方,只留下轮子的声音逐渐消失在他身后。
对于音效,我添加了另一个简短的描述:
提示:石板路上轻微滚动的轮子声,技巧期间轻敲的声音,以及男孩离开时的渐弱声音。
这就是你的Img2Vid仪表盘的样子:
点击“创建”按钮并等待最终视频渲染完成(视频链接)。
我知道,这个视频特别令人印象深刻。
大约在四秒的时候,他的脚看起来短暂地分裂成三个。这种问题在视频模型中仍然相当常见,尤其是在主体快速移动时。即使如此,我认为视频还是不错的。
4、多角色视频的一致性
Kling 2.5 Turbo最具前景的改进之一是它能够更准确地处理多角色互动。在之前的模型中,生成多个角色的场景通常会导致混乱或不一致的结果。
看一下下面的例子,其中有三个角色:一只猫头鹰、一只兔子和一只狼。假设你想让他们以特定方式行动。大多数视频模型都很难正确渲染出正确的视频。
提示:首先,右边的狐狸用前爪翻阅一本书。然后,兔子惊讶地看着猫头鹰。最后,左边的猫头鹰不耐烦地飞过去并落在书上
生成的视频如下(链接):
在这个例子中,可以看出Kling 2.5 Turbo如何很好地遵循用户给出的指令。所有元素,包括他们在场景中出现的顺序,都正确无误地完成了。
想象一下,这对于想与学生分享儿童故事的老师来说有多酷。他们不再只是展示静态图片,而是可以生成故事的视频。这比静态图片对孩子来说更有娱乐性!
5、震撼的人类表情
Kling 2.5 Turbo让我最兴奋的功能之一是它在处理人类表情方面的表现,特别是在特写镜头中。
看这个例子:
提示:实时速度。在一列摇晃的电车上,相机极其靠近一位坐在窗边的美丽少女。苍白的皮肤,长长的金发披在肩上,戴着耳机,眼睛闭着,神情平静,嘴唇略微紧闭。阳光透过窗户洒在她的眼睑上,形成一块柔和的斑点。其他乘客模糊地经过,背景中有金属轨道和铃声的微弱声音。她的头发随着电车轻轻摆动,然后她慢慢睁开眼睛,睫毛颤抖,目光聚焦在窗外,若有所思。真实的自然光线,温暖的色调,浅景深模糊了背景,突出了她的脸和耳机。相机固定在前方,缓慢地从特写推进到超近景,聚焦在睫毛和眼睛上,捕捉她睁眼时的微妙变化,充满沉浸式的情感和紧张感。
生成的视频如下(链接):
这是我第一次看到AI视频成为戏剧电影的真实选择,其中情感和细节至关重要。皮肤质感、头发对光的反应以及面部的细微表情共同使场景显得生动。
在另一个案例中,Kling 2.5 Turbo展示了它也能处理更具表现力和更具挑战性的情绪。
提示:实时速度。昏暗的马戏团后台,诡异的氛围,一盏头顶灯投下冷白色的光芒,空气中漂浮着灰尘。镜头从特写开始,面对一个穿着破旧服装的小丑,脸上涂着白色妆容,红鼻子,口红涂抹。他一开始大笑,露出牙齿,眼角皱纹拉伸。慢慢放大镜头:笑声渐渐消失,嘴巴下垂,眼睛黯淡,黑色眼泪顺着画好的脸流下。背景变得寂静,只有他的呼吸声。突然,他抬起头,嘴扭曲成一个邪恶的笑容,牙齿在冷光下闪闪发光,眼神冰冷。眼泪和微笑同时存在,既滑稽又可怕。镜头轻微抖动,定格在他诡异的表情上,创造出强烈的心理紧张感。
生成的视频如下(链接):
该模型不仅成功地完成了这一任务,还添加了令人不安的细节,比如小丑嘴里的血滴和刺眼的眼神,使整个场景恐怖无比。
这种结果让我想到我们离在实际电视剧中看到AI生成的片段还有多远。我不奇怪Netflix或亚马逊会在不久的将来将这类场景纳入他们的制作中。
6、结束语
在过去几个小时里,我一直在用Kling 2.5 Turbo生成视频,直到我在Pollo AI上用完了积分。最让我印象深刻的两点是视频的更长时长和更便宜的价格。
目前大多数顶级AI视频生成器已经能生产出非常高质量的视频。它们开始看起来非常相似。但是Kling 2.5 Turbo提供高达10秒的生成时间,这使其明显优于Veo 3,后者最多只能达到8秒。
成本也是一个巨大的因素。大多数开发者,包括我自己,都没有大预算来运行像Veo 3这样昂贵的模型。因此,现在Kling 2.5 Turbo出现了,它是一个更实用的选择。我可能会将其用于我自己的网页应用,如Pixono AI。
我上面展示的例子只是触及了这个模型所能做的表面。因此,我强烈建议你尝试Kling 2.5 Turbo,特别是当Pollo AI的积分仍处于折扣时。
原文链接:Kling 2.5 Turbo Tutorial: How To Use This Latest Video Model!
汇智网翻译整理,转载请标明出处