国货太强了！最全盘点大片AI视频模特：柯灵、姬梦莎都疯了

发布时间：2024-10-21浏览：54

大家好，今天来为大家分享国货太强了！最全盘点大片AI视频模特：柯灵、姬梦莎都疯了的一些知识点，和的问题解析，大家要是都明白，那么可以忽略，如果不太清楚的话可以看看本篇文章，相信很大概率可以解决您的问题，接下来我们就一起来看看吧！

海量资金支持的AI视频生成赛道一定会给我们带来更多惊喜，不过在此之前，趁着这个年中时刻，小雷带大家回顾一下今年上半年的AI视频大模型产品年。看看各大车型公司都发布了哪些新产品，以及他们在产品方向上做出了哪些新的改变。

Sora持续隐身，快手科灵AI火爆全网

1、Sora：引领视频生成技术路线创新

说实话，说实话，在产品队列中讨论Sora并不合适，因为Sora到目前为止还没有向公众开放，只有工业界和设计界的少数人被邀请使用它。不过，考虑到Sora的出现在全球范围内推动了AI视频生成技术的进步，为了方便大家理解，肖雷认为还是有必要回顾一下。

在OpenAI发布Sora模型之前，业界的领军者有Runway、Pika Labs以及Google VideoPoet等一批资深的AI视频生成玩家。它们没有引起全球关注的最大原因是生成视频的技术难度非常高。

来源：索拉

制作视频不仅依赖先进的算法和强大的计算能力，还必须解决一致性、连贯性、物理合理性、逻辑合理性等多种复杂问题。这些因素共同确保了视频内容的流畅性、真实性和可信度。

早期，Runway 主要依靠两种模型：GAN（生成对抗网络）和VAE（变分自编码器）进行视频生成。后来又演化出了两条技术路线，分别是扩散模型和Transformer模型，两者各有优势。可以说，各有千秋。

根据OpenAI发布Sora当天给出的技术解释，Sora是扩散模型和Transformer模型的结合体。尽管在Sora发布之前，组合解决方案已经成为业界的共同方向，但OpenAI作为第一家发布demo的公司，已经在AI视频生成领域奠定了行业地位。

从目前的情况来看，OpenAI无意将Sora公之于众。在竞争日益激烈的人工智能视频生成领域，Sora的持续隐身将为其他竞争对手提供追赶甚至超越的机会。

2、快手科灵AI：国产AI火爆国外，高频更新值得期待

在2024世界人工智能大会（WAIC）上，快手高级副总裁余越介绍了科灵AI的一些产品更新和最新数据。作为一款刚刚发布一个月的产品，科灵AI的更新相当频繁。产品已从内测时的App端扩展到Web端；功能也从文森视频更新为图胜视频、视频续传、多尺寸选择、高清版本、首尾帧控制、镜头控制等新功能。

据快手披露的数据显示，科灵大模型上线1个月以来，累计申请用户数50万+，激活用户数30万+，生成视频量700万条。同时，科灵AI以其大规模运动的合理性和对物理世界特征的高模拟能力，在国内外社交媒体和科技社区广泛讨论。

图片来源：科灵AI生成

自OpenAI发布ChatGPT以来，公众普遍认为OpenAI代表了AIGC领域的领先水平。尽管空还没有上线，但类似的看法并没有太大改变。不过，作为体验过科灵AI内测的人，小雷可以明确地说，科灵AI无论是在生成时间、效率、还是视频质量，尤其是实景场景下，目前都处于AI视频生成产品的第一梯队。其性能令人印象深刻，以至于许多AIGC 视频如果不仔细观察甚至无法发现是由AI 生成的。

在Sora正式发布之前，外界很难判断哪一个更好，但快手科灵AI的出现让我们看到了在AI视频生成领域超越的可能。此外，快手还宣布首部AIGC短剧《山海》将于本月上线。期待科灵AI给我们带来新的惊喜。

3、字节梦AI：重大进展，AIGC短剧给行业带来新机遇

同样测试AIGC 小品的还有极萌AI。在今年的上海国际电影节上，由抖音和博纳影业出品的AIGC科幻短片《三星堆：未来启示录》正式亮相。

纯AI制作是该剧的最大亮点。借助AIGC剧本创作、概念和故事板设计、图像到视频转换、视频编辑和媒体内容增强等十项AIGC技术，有望解锁传统影视公司与AIGC技术产品的合作。走出一条新的发展道路。

图片来源：极盟AI生成

极盟AI是字节旗下一站式专业AIGC内容创作平台。支持文声视频和图声视频，并提供智能画布、故事创作模式以及首尾帧、口型同步、摄像机移动控制、速度控制等AI编辑功能。

今年5月，Dreamina正式更名为Dream AI，小雷也第一次体验到。与成熟的AI作图相比，Dream AI当时的AI视频水平有些令人失望。文森特视频的自然语言理解能力没有问题，但视频质量确实需要提高，尤其是在真实的身体特征方面。梦想AI还需要继续努力。

图胜视频为AI指明了方向，不再需要富有想象力的组合步骤。视频质量比文盛视频好很多。但当视频主体大幅度移动时，仍然会出现闪烁、失真等问题。

当然，小雷体验到的只是极萌AI的初始版本。经过一段时间的发展，极萌AI已经达到了可以生成AIGC短剧的水平。进展令人惊讶。小雷期待已久的故事创作模式相信很快就会正式向公众开放，届时普通用户或许也能创作出属于自己的AIGC系列。

4.跑道：Gen-3重大更新，演示效果不逊色于Sora

作为老牌的AI视频生成厂商，Runway的视频生成模型Gen-1和Gen-2在早期就获得了不少好评。随着竞争对手陆续推出搭载最新视频一代机型的产品，Runway的机型长期落后。内部争议不断。

今年6月，Runway连夜发布了基于最新视频生成模型Gen-3生成的各种演示视频。电影级的画面细节直接震惊了所有网友。 7 月2 日，Runway 宣布Gen-3 向所有用户开放。小雷原本想尝试一下，但每月12美元的会员费说服了我退出，所以我只能从演示视频屏幕上进行分析。一两个。

官方展示视频时长10秒。人物生成中人物的面部细节和情感营造都比较细腻，场景和风景生成中的元素、光影并没有太多的不和谐感。例如，在这段视频中，一名女子乘坐一辆汽车穿过一条明暗交替的街道。外部光源照射下的人脸变化非常自然，不存在车外驶过的车辆间隙等不一致的场景。

图片来源：Runway 生成

官方视频的效果令人惊叹。虽然不知道正式使用效果如何，但就目前来看，我个人认为并不逊色于Sora。

5、造梦机：视频质量波动大，使用成本高

6月12日，初创公司Luma AI发布了全新的AI视频生成模型Dream Machine，并开放测试。很快，不仅发布了一系列官方样品，社交网络上还出现了大量网友通过“造梦机”生成的视频。

坦白说，肖雷对《造梦机》官方视频的第一印象是相当惊艳的。除了人物和背景的一致性之外，最令人惊讶的可能就是光照的变化，包括亮度的变化，这也符合基本的物理定律。

图片来源：Luma AI 生成

《造梦机》每月为普通用户提供30次免费生成机会。除了免费用户外，《梦想机器》还提供三种付费选项，包括标准文件29.99美元、专业文件99.99美元、高级文件499.99美元。文件，区别在于每月可以生成的视频数量。

更长、更真实、更多样化，AI视频不断进化

首先，今年AI视频最大的突破之一就是生成视频长度的延长。需要注意的是，小雷指的是模型极值区域的时长，而不是消费端的时长。此前，Runway和Pika都只能生成3-4秒的视频，对于行业和用户来说太短，无法满足长素材的需求。

小雷整理了已发表的大模型视频生成时间，其中Sora为60秒，Vidu为32秒。快手真是太棒了。其提供的视频续播功能支持视频内容多次连续续播。在保证视频一致性的前提下，可以生成长达3分钟的视频。在视频时长方面，快手可以说是遥遥领先。

其次，大视频模型产品输入方式的多样化。用户不再局限于文本输入，而是可以选择图像和视频作为输入，模型将根据用户的输入生成视频。例如，用户可以上传静态图像，视频模型将根据该图像创建视频。

最后，人们对AI视频最大的期待就是足够真实。如上所述，生成视频的技术难度远高于生成图像。此前，人工智能生成的视频有两个缺点。第一个是如何使生成的视频符合物理定律，这通常发生在人或人与物体的复杂交互过程中；第二个是时间连贯性，即让AI记住视频中的人和物体，即使它们暂时被遮挡或移出屏幕，当再次出现时视频也能根据物理逻辑保持连贯性之后。

这两点今年都有了很大的改善。例如，在快手科灵AI生成的这段视频中，当饺子进入孩子嘴里时，部分饺子被完全挡住。当饺子再次出现时，吃饺子留下的咬痕和咬痕最终的饺子形状也能继续自然地移动，保持时间和物体的连贯性。

图片来源：科灵AI生成

这意味着视频生成模型初步获得了“理解”世界的能力，理解物体运动过程中的物理世界，并预测视频中接下来可能发生的情况。

下半年，AI视频生成领域还会有哪些新惊喜？

从目前的发展趋势来看，今年下半年，将会有更多的企业加入到AI视频生成的技术竞争中来。毕竟，过去六个月，大量资本和热钱涌入该行业，新老玩家都忙着推出产品。

在2024年世界人工智能大会（WAIC）上，信谊科技展示了基于信谊视频模型的一系列产品和应用场景解决方案，并正式发布信谊视频模型2.0版本。目前，信义科技已打造文旅、金融保险、媒体、营销、出版、政务、教育、汽车、医疗等多个场景的实施解决方案，大幅提升各垂直领域的创造力和生产力。

来源：信义科技

这其实是下半年的一个大趋势。 AI视频生成赛道也将从滚动模型升级为滚动模型。下半年，我们预计会看到更多基于大视频生成模型的AIGC应用，这意味着我们将在更多场景中看到AIGC内容。

如前所述，AI视频的使用场景正在不断拓展，除了AIGC短剧之外，还增加了大量新场景。随着无线网络、AI大模型等技术的不断发展，AI视频应用的场景和功能将逐渐发生变化。很有可能，未来我们看到的广告、短视频、影视内容都是AIGC生成的，采用真人拍摄的机会会越来越少。

AI视频还有更大的潜力，等待挖掘。

2024年上半年，科技圈动荡。

大机型落地加速，AI手机、AI电脑、AI家电、AI搜索、AI电商……AI应用层出不穷；

Vision Pro上市发售并登陆中国市场，掀起XR空间计算的又一热潮；

HarmonyOS NEXT正式发布，改变移动操作系统生态；

汽车全面进入“下半场”，智能化成为重中之重；

电商竞争日趋激烈，价格更低，服务更好；

海外扩张浪潮汹涌澎湃，中国品牌踏上全球化征程；

用户评论

海盟山誓总是赊

我一开始都不太相信国产也能做出来这么好的AI视频模型，看了你们的介绍我才发现厉害的地方太多了！尤其是那一堆实际应用的案例，感觉现在很多创意都可以轻松实现啦...

有14位网友表示赞同！

琴断朱弦

别的不说，就这可灵和即梦两个模型确实很让人惊艳，特别是可灵那逼真的画面风格简直是太棒了！视频生成的速度也是非常快的，我试用了一下，效果绝赞。

有9位网友表示赞同！

栀蓝

这次的国产AI视频大模型盘点真是太精彩了，让我对国产技术的实力重新认识! 还是希望以后能看到更多更酷炫的功能和应用，比如可以一键生成特定风格的视频...

有14位网友表示赞同！

早不爱了

说实话，《即梦》这个名字就很霸气！视频效果确实很强，但目前来看还是比较依赖用户提供的文本指令，如果将来能实现更加自由化的创作，那将会是真正的突破啊！我越来越期待了，国产AI发展真的太快啦！

有20位网友表示赞同！

将妓就计

感觉现在很多AI生成的内容都差不多，一个公式化模板…希望未来模型能在创意和表达方面更上一层楼，而不是只是单纯的把用户想法翻译成视频而已。

有11位网友表示赞同！

打个酱油卖个萌

我很好奇这些AI模型的训练数据是哪些？能不能公开一些信息让大家了解一下? 毕竟技术革新需要大家的共同参与和探讨嘛!

有15位网友表示赞同！

西瓜贩子

国产AI视频大模型最全盘点！看得我眼花缭乱啊，这么多模型我都还没听过呢！看来以后得好好学习一下，看看能不能借鉴他们的经验来提高我的创作水平。

有8位网友表示赞同！

残花为谁悲丶

我觉得这些AI视频生成工具虽然很强大，但还是不能完全替代人的创造力。毕竟，每个人的情感和理解方式都不同，只有真正的人才能赋予视频灵魂...

有12位网友表示赞同！

暖瞳

话说回来，现在这技术发展也太快了吧？还没开始学呢，就已经落后很多了！这可灵、即梦真厉害啊!

有10位网友表示赞同！

羁绊你

看了这篇博文突然觉得国内AI技术真是太牛啦，以后还有更多更高级的应用可以期待! 越来越期待人工智能对我们生活的改变.

有7位网友表示赞同！

青衫故人

这些模型都是开源的吗？我想试试自己用它们生成一些视频

有20位网友表示赞同！

失心疯i

国产能做出来这样厉害的AI视频大模型，真是让人自豪！以后这种技术应该会越来越多出现在我们的生活中吧，想想都刺激!

有14位网友表示赞同！

等量代换

我还蛮担心这些AI技术会取代很多人的工作，比如视频剪辑师、特效师等等？

有16位网友表示赞同！

强辩

我对可灵的应用场景更感兴趣，它能帮助我们进行更好的内容创作吗？比如新闻报道、宣传片什么的？

有20位网友表示赞同！

窒息

其实我觉得，现在做出来的AI视频生成的画风还有些僵硬，缺乏真实感。希望能看到未来模型能够生成更加细腻、富有情感的视频。

有9位网友表示赞同！

无寒

真的佩服这些开发者们的工作！为了打造这么强大的AI模型，肯定付出了很多努力和资源。希望他们能继续突破创新，为我们创造更多惊喜

有15位网友表示赞同！

清原

我一直觉得视频本身就是一种艺术形式，而AI只是辅助创作的工具。最终还是需要人类赋予视频灵魂和内涵。

有10位网友表示赞同！

陌颜幽梦

这几个模型的名字都很有意思啊！每个名字都传达了自己的特点... 我比较想学习一下这些模型的训练方法，看看能不能应用到我的研究项目中

有13位网友表示赞同！

热点资讯