周鸿祎谈文生视频大模型:工程化思路仍需探索

【金色港湾资讯网为您推荐阅读】

现在Sora(文森视频推出的大尺度模型)大受欢迎,那么国内的大型模型公司如何才能赶上Sora呢? 有哪些困难?

360集团创始人周鸿祎近日在接受新京报贝壳财经记者采访时表示,如果Sora的技术路线开源的话,国内一定能快速赶上,但追上Sora的时候,算力可能会下降。成为门槛。 对此,集中国内所有AI公司的算力或许是一种方式。

Sora已确定技术路线,但工程思路仍需探索

《索拉》上映后,周鸿祎发布了十多个视频谈论这个大模型的文森特视频。 他认为,索拉对物质世界的许多描述都符合常识和人类对世界的理解,因此索拉不能被视为只是文森特的视频。 工具,而是要看其背后人工智能的发展。

至于Sora使用的技术,周鸿祎表示,目前Pika等文森特视频公司可能只使用文森图模型相关技术,但Sora将文森图模型技术与文森特模型技术结合起来,因此可以实现惊人的结果。 。

周鸿祎告诉贝壳财经记者,以Sora为代表的技术路线发布后,国外也出现了两条斗争路线。 一种是美国开放人工智能研究中心的闭源,另一种是基于Meta(母公司)的。 开源代表,“开源路线的目标是打破闭源,他们会不断猜测闭源是怎么做的,最后开源。开源的好处是,很多小公司的个人成员而大公司会积极在开源项目中学习别人的成果,同时贡献自己的成果,化学效应会非常明显。”

在他看来,一旦Sora的技术开源,国家就能迅速赶上。 一个可供参考的事实是,一年前的今天(人工智能聊天机器人)轰动科技圈,国内企业用了不到一年的时间就达到了GPT3.5的技术水平。

周鸿祎告诉贝壳财经记者,他曾与多位AI(人工智能)专家交流,发现目前很多技术所使用的模型和算法都是公开的。 他认为最大的能力之一就是找到方向,另一个就是工程。 思路非常严谨。 因此,现在有必要探索工程思想。 “之前学习的过程中,大家在确定方向的同时,也解决了‘如何跨过某个特定的坎’、‘如何翻过一座山’的问题,遇到了很多陷阱,验证了很多具体的方法,这需要时间。”

周鸿祎坦言,与美国相比,中国在人工智能技术上存在差距是客观事实。 “虽然在排名中,国产大车型基本垄断了前1到前10名,而GPT-4则排在第10名之外。但Sora的出现还是给我们泼了一盆清醒的冷水。”

“我认为手里还有一些秘密武器没有被揭露,比如GPT-5。这个什么时候发布完全取决于Sam (CEO)的心情和他的节奏感。” 周鸿祎预测道。

面对中美差距,周鸿祎认为,只有正视差距,才能迎头赶上。 在他看来,中国企业在AI领域与领先企业的差距并没有想象中的那么大,因为无论是模型还是Sora,本质上都是软件,所以这个差距在掌握了技术之后可能还需要一到两年的时间。方向。 时间会解决它。

Sora可能会产生更长的视频,国内追求应该集中在算力上

周鸿祎还认为,计算能力也可能是追赶Sora的障碍。

此前有专家分析,Sora的参数并不大,大约有30亿。 周鸿祎对此表示反对,“这是误解了一个概念,视频的参数和文字的参数不能简单比较。文字有10万字,而视频只有640×480,它们占用的存储空间是完全不在同一个数量级上,所以Sora可能不仅有30亿个参数,其次,即使只有30亿个参数,视频分析的算力消耗也应该远远超过1000亿个模型。因此,现在国产显卡卡住的时候,算力可能是个问题。”

“为什么Sora只能制作1分钟的视频?我猜是因为它与4秒和6秒有本质上的不同。4秒和6秒都是在对世界一无所知的情况下使用像素生成的。4秒和6秒后的这张照片如何关于它?你就是想不通。” 周鸿祎猜测Sora可以生成一分钟的视频,也就是说它也可以生成10分钟、60分钟的视频,但为什么不这么做呢? 这是由于计算能力和成本的限制。

同样,中国人工智能产业也出现了算力问题。 对此,周鸿祎表示,他正在考虑是否提出以下建议,“目前Meta已经拥有50万块GPU,明年可能会购买100万块。微软也应该下百万级别的订单。而且全部是国产GPU人工智能公司可能总共拥有50万个GPU,但它们都分散在各个公司中。”

他正在考虑是否可以集中国内所有的GPU算力。 “我最近之所以科普,是因为索拉不仅仅是文盛视频的一个工具,如果是的话,我们就落后了,无非是广告方面落后了。” 有一件事,电影应该拍得慢一点。 除了可能对娱乐业造成影响外,这些落后并不会影响大国之间的竞争。 但事实上,Sora预示着AGI(人工智能)的一个关键节点,所以我认为这对国家来说非常重要。 ”。

人工智能对行业产生积极影响,需要科普教育。

此外,周鸿祎还谈到了当前公众对AI可能“颠覆行业”的焦虑,以及由此引发的AI“卖课”现象以及网友将李一洲比作山姆奥特曼引发的争议。

在他看来,尽管问题很多,但李一洲还能卖这么多课程,说明大家都需要科普教育。 “很多人在谈论人工智能时都会感到害怕。 比如人工智能会带来行业的崩溃,但是只要使用了人工智能,你就会发现人工智能是人类最好的朋友和工具。 它让人们解锁技能,比如用AI画画、制作视频等。AI不会带来行业的崩溃,反而会对行业产生积极的推动作用。 肯定要你自己用过才知道什么是AI。”

但周鸿祎认为,有时候讲这些道理是“没有用的”,因为“现在,只要一个摄像头,人们就可以在网上谈论,别人也不知道谁对谁错。” 在他看来,目前有两种观点,AI恐惧论和AI万能论,这两种观点都是不可取的。

周鸿祎表示,现在企业普遍向往AI,但又不知道从哪里入手,尤其是非AI企业,离AI还很远。 企业首先要树立对人工智能的信念,分为三个步骤。

企业第一步不要急于将人工智能与自己的业务结合起来,而是先熟悉人工智能。 “企业可以先开发一个私有化的通用大模型,这个模型不解决任何直接的业务问题,但它具有通用大模型的通用能力。目的是让企业的员工和领导先使用它,然后熟悉它与并理解大型模型。”

第二步是企业在定制人工智能之前,先将大数据平台升级为知识平台。 因为企业想要培养AI,首先必须要有相应的知识,但很多知识都属于“暗知识”。 这些知识在外面的互联网上是找不到的。 它仅供企业使用,但也分散在不同员工的计算机和电子邮件中。 还有聊天记录,这些“黑知识”都要总结一下。

第三步,有了知识平台之后,企业需要在业务中选择几个小场景,然后先训练一些小的垂直模型与业务融合,然后逐步用大模型赋能企业的业务。 在周鸿祎看来,“这样做的过程就是提高新生产力的重要体现。”

在他看来,大车型必须进入数千个行业,并与特定的业务和产品功能相结合。 他们不仅要有大脑,还要有专业领域知识,就像成长的“手”和“脚”一样。 在一些垂直领域,大模型的能力完全有可能超过GPT-4。 “没必要每个人都去开发几百亿的模型。 只开发几百亿的模型也是有价值的。 同时,这样的企业性价比也高,而且买得起。”

新京报贝壳财经记者 罗一丹

周鸿祎谈文生视频大模型:工程化思路仍需探索(图1)

海量信息、精准解读,尽在新浪财经APP

顶一下
(0)
0.00%
踩一下
0
0.00%

您可能还会对下面的文章感兴趣: