视频大模型，快手美图异曲同工

liukang20244个月前 (04-18)今日吃瓜1210

有图画视频事务傍身的互联网企业，加快奔向大模型。近来，快手正式上线视频大模型“可灵”并开端邀测，用户输入一段文字即可生成视频。美图宣告将在7月底上线新品MOKI，该产品依据美图奇想大模型的视频生成才干，可协助用户生成AI短片。不论是做视频仍是做短片，都是经过大模型辅佐用户发明，契合自己的主营事务。现在，取得内测资历的用户能够免费运用可灵，其他AI功用以限时免费、限次免费等方法向用户敞开。美图相关人士并未泄漏KOMI的变现方案，但付费会员、单次付费等变现方式已是美图老练的商业方式。

不谋而合

“今日你‘可灵’了吗？”6月12日晚间，快手经过官方大众号向用户“安利”自家的视频生成大模型“可灵”。为了证明实力，快手不但拿出一条由快手可灵生成的一分钟预告片，还放出一系列第一批取得测验资历的发明者生成的视频，如一朵花开放的进程、复生成语故事《对牛鼓簧》等。

翻开快手的视频编排App快影，进入主页的“AI玩法”，再点击“AI生成视频”模块填写问卷，即能够请求免费的内测资历。依据内测网友供给的信息，用户能够输入一段200字以内的文字描绘，自行挑选超现实主义、极简等风格，再等候约3分钟，就能看到由可灵生成的一段5秒视频。

来自快手的最新数据显现，到现在，在快影App上请求文生视频内测资历的人数已超6万，图生视频功用将于近期上线。

相同瞄准视频大模型出手的还有美图。“现在商场上的AI视频产品倾向于供给文生视频等才干，咱们以为只要深度了解发明者的需求，提炼有共性的视频场景，才干打造辅佐内容发明的东西。”美图创始人吴欣鸿谈到MOKI时说，“MOKI聚集于AI短片发明，专心于动画短片、网文短剧、故事绘本和MV等视频场景。”

详细的作业流程是：在脚本、视觉风格、人物等前期设定完结后，AI主动生成分镜图并转为视频材料，经过智能编排、AI伴奏、AI音效、主动字幕等功用串联材料并完结成片。MOKI的上述才干即依据美图奇想大模型。

热度升温

除了快手、美图，近来视频生成的网红运用Pika、联合清华大学发布视频大模型Vidu的生数科技，也为视频大模型赛道添了一把柴。

Pika不久前经过官网宣告，Pika已完结总额8000万美元的B轮融资，由Spark Capital领投，Greycroft、Lightspeed Venture Partners以及Jared Leto参投。Pika团队表明，这一轮融资将加快公司构建最佳视频模型的进程，一起协助聘任优异的人才。

建立于2023年4月，爆火于2023年11月，早在Sora出生前，Pika就依托AI生成和修改3D动画、动漫等多种风格的视频，成为网红运用。

生数科技仅比Pika早建立一个月，首要事务会集在图画、3D、视频等原生多模态大模型的研制。2024年4月，生数科技联合清华大学发布的视频大模型Vidu，支撑一键生成16秒、分辨率1080P的高清视频内容。

6月初，生数科技宣告，已完结数亿元Pre-A轮融资，由百度、北京市人工智能工业出资基金领投，此前这家创业公司还取得了来自蚂蚁集团、智谱AI等的出资。生数科技称，将在本轮融资完结后坚持其原生通用多模态技能道路，继续迭代优化自研大模型，并加快产品开发与商场拓宽。

“近期视频大模型活泼，说明大模型最早构成的一些技能壁垒在被打破。”文渊智库创始人王超告知北京商报记者，“我以为能超越GPT-4的我国大模型或许在年中就会呈现。我国的算力、动力和人才，支撑着我国大模型继续追逐。”

谈及视频大模型的门槛，中经传媒智库专家张书乐向北京商报记者表明，“视频生成不是将一堆AI绘画连在一起变成动画片，除了考虑形象共同、契合描绘、光影切割、分镜体现等，还要具有对剧情的了解才干、再发明才干，这些都需求对视频结构、内容解析等多个笔直范畴进行深度学习，难度高于谈天、绘画或棋类等靠首要数据堆积和用户纠错完结的功用”。

跟着事务走

2022年末OpenAI的ChatGPT让国内科技巨子在生成式大模型赛道扎堆，且大多瞄准对话式互动方式，2024年OpenAI又推出文生视频模型Sora。和蜂拥而至的大言语模型竞赛比较，在视频大模型范畴比拼的主角更多是图画视频类互联网公司。

站在技能的视点，王超以为，“这两种大模型尽管都是AGI（通用人工智能），但技能道路不同，OpenAI两个都做，但不是每个企业都有这样的才干”。

在视频大模型赛道，“快手和美图的最大优势在于用户堆集、算法和数据处理等方面的经历”，深度科技研究院院长张孝荣表明。

张书乐的观点是，“快手、美图具有能够让人工智能深度学习的‘学习材料’，且能够躲避必定的版权问题。这两家企业在视频范畴的内容堆集、笔直细分的标签标示，能让大模型更好地‘检索’常识”。

不过第三方观察者也提示，做视频大模型的难度比大言语模型更高，远景还不清晰，“这是没多少国内大模型创业公司进入视频大模型赛道的原因，连巨子都没那么活跃”，王超说。“视频大模型的变现比大言语模型困难”，张孝荣弥补。

快手和美图正经过各种手法招引更多用户运用AI，并寻觅AI变现的途径。以快影的AI发明功用为例，快影向用户供给AI舞王、AI小说转漫画、AI变装、AI头像壁纸等十几种服务，其间AI舞王供给免费5次的运用时机、AI变装限时免费、AI小说转漫画是VIP会员的权益。

美图相关人士并未向北京商报记者泄漏MOKI或许的变现方式，但吴欣鸿在介绍美图新品时屡次说到产品的商业化数据，在他看来，“假如AI帮用户创收，用户是很愿意为能发明价值的AI产品付费的”。

北京商报记者魏蔚

告发/反应

标签: 美图快手异曲同工视频模型

返回列表

上一篇：速度分散！今日早上安顺8岁男孩上学途中迷路，你见过他吗？

下一篇：愚人节后美国加税，制造业回流恐成空想

51吃瓜网

视频大模型，快手美图异曲同工

相关文章

这些亚洲文明，今日天翻地覆绚烂！

西蒙尼：期望有一天能执教阿根廷，巴萨国米曼城是现在最好的球队

看·见｜一词压两宋，历史上的岳飞与《满江红》

姑苏一直升机掉落致1死4伤

传送门吃瓜网友科普：一个女一个弟读什么字？揭秘汉字奥秘

继续深化政治互信，深化发展战略对接，中马打造高水平战略性命运共同体

Copyright Your WebSite.Some Rights Reserved.

Powered By 吃瓜黑料. Theme by TOYEAN.