万字梳理中国AIGC财产峰会激辩,大模子应用最全行业参考在此 ...

交流
风子君度 2024-5-14 13:11:23 536 0 来自 中国
有算力就有逾越Sora的大概。
70%的代码题目,如今单纯靠基座模子办理不了。
基于垂直场景的大模子应用创新,只有两年的窗口期。
ROI是权衡AIGC应用代价的第一尺度。
AI给了每个人一次突破本身的时机。

……
在中国AIGC财产峰会的现场,20位大咖睁开激辩。从软件应用、智能终端以致具身智能等,AIGC正在全面席卷,「你好,新应用!」成为本届AIGC峰会主题。
来自AIGC底层底子办法、模子层、应用层的企业玩家,以及来自市场学术界的洞察者,泛论大模子落地元年这个万亿市场的的机会与挑衅。
现场乌泱泱一片,500人的会场可以说是座无虚席(实在站也要没有席了)。




线上也有数百万网友围观并积极讨论,以及数十家行业着名媒体到场了大会的直播跟报道,全网总曝光量超万万。
为了让更多读者更全面、体系地相识本次AIGC峰会的内容,深入感知这股期间海潮的发展,量子位团结各大模子做了万字梳理,盼望能为各人提供一份有代价的行业参考。
(发起收藏再食用)
本次梳理重要围绕五个方面睁开,分别是AIGC的模子层、应用层、底子办法层的到场者,以及行业洞察者的观点,末了是圆桌讨论的出色观点。
AIGC模子层:微软阿里高通等玩家谈落地
微软李冕:AI应用已进入新阶段,微软助力企业级应用环球落地
微软大中华区Azure云奇迹部总司理李冕分享了微软Copilot与Azure AI平台怎样助力企业级应用的环球落地。
李冕以为,已往12个月AI履历了数次迭代,如今AI应用已进入到一个新的阶段。企业怎样打造本身的应用?怎么实现AI带来的真正代价?可以从四个方面来思量应用落地:提拔员工生产力,重塑与用户的互动关系,重塑企业内部流,增强产物和服务




他夸大了在企业打造本身的应用时微软可以为企业提供的一系列支持。
AI模子层面,李冕睁开先容了Azure平台支持的三类模子,分别是OpenAI系列模子、第三方开源模子和企业自研模子(BYOM)。同时,也报告了小模子(SLM)在特定场景下的应用远景。
对于开辟工具,李冕提到Azure提供低代码、无代码的Microsoft Copilot Studio工作台以及针对深度定制的Azure AI Studio,方便企业快速开辟AI应用。
思量到企业级应用需求,李冕还表现微软不但在最上面的模子层为企业提供支持,还提供下面的调理层、硬件层、云数据中央等的一系列配套服务。
李冕在演讲末了重申了微软在数据隐私安全方面的答应:
“客户的数据就是客户的数据,客户的数据不会被用来练习别的模子,全部客户数据均有企业级防护,受到全面的企业合规和安全控制的掩护。”
昆仑万维方汉:天工SkyMusic音乐大模子将大大低落音乐创作的门槛和本钱
昆仑万维董事长兼CEO方汉分享了“天工多模态大模子的演进落地”。大会当天,昆仑万维发布了「天工3.0」,这是中国音乐AIGC范畴首个实现SOTA程度的模子。同时,他还公布「天工3.0」基座大模子与「天工SkyMusic」音乐大模子正式开启公测




「天工3.0」拥有4000亿参数,逾越了3140亿参数的Grok-1,是环球最大的开源MoE大模子。在MMbench和MMbench-CN测试集上,「天工3.0」性能指标全面逾越GPT-4V。
通过专项的Agent练习,现在大模子可以做到“能搜能写能读能聊能说能画能听能唱”,应对多种复杂的内容创作需求。比方,它可以正确辨认“成都迪士尼”是个梗,并给出嬉戏攻略;可以主动总结文献,天生大纲、PPT和脑图;还可以通过非代码方式天生智能体。
方汉特殊先容了「天工SkyMusic」音乐大模子,得益于2000万首音乐的练习数据和独特的模子架构,「天工SkyMusic」在人声辨认度、音质等方面已经逾越Sora。「天工SkyMusic」支持根据音源和歌手特点天生音乐,并支持多种方言合成,大大低落了音乐创作的门槛和本钱——
各行各业利用的歌曲都能通过AI天生,本钱敏捷从几万块钱降到几分钱。
末了,方汉分享了昆仑万维的愿景:“实现通用人工智能,让每个人更好地塑造和表达自我。”他以为,大模子的演进终将实现AGI,而AIGC本领遍及则有助于冲破强势文化的把持,实现文化平权。作为一家环球化互联网企业,昆仑万维盼望用AI技能为环球用户赋能。
阿里通义千问林俊旸:智能模子应融入对视觉/语音的明白
阿里通义千问开源负责人林俊旸,在现场分享了阿里通义千问大模子为“走向通用大模子”做出的积极。




林俊旸表现,自开源以来,通义千问Qwen(为了更方便英文发音,对“千问”的音译)系列模子受到了国表里开辟者的广泛关注。
从客岁8月开始,通义千问Qwen系列模子连续开源上新。从7B、14B参数规模巨细开始,直到开源了72B参数版本;最新动作,阿里通义千问家属另有一名“小成员”,是14B参数的MoE模子。而开辟者社区的急迫需求,促使阿里快速开源了32B模子——这个模子的体现与72B参数模子体现靠近,而且在某些方面相比,比MoE模子还具有上风。
林俊旸在现场夸大,阿里通义千问同时非常专注打造大模子利用生态
起首,通义千问的代码已经官方融入了抱抱脸的代码库,开辟者可以更方便地利用通义千问的模子。
其次,通义千问在第三方框架支持方面有不少希望,包罗ollama在内的平台,都能一键利用Qwen系列模子。




多语言、长序列、Post-training、Agent、多模态等本领相干题目,林俊旸也在现场做了分享。
多语言:通义千问模子本质上是多语言的,而非仅仅是中英双语的;而且,团队在多语言本领上举行了检测和优化。
长序列:Qwen系列模子不停没有卷长文本,这件事并欠好做,不但要包管“长”,同时要包管结果;现在32k版本体现已经比力稳固;大海捞针等评估发现长序列可以在Chatbot上落地实勤奋能。
Post-training:通过SAT等在数据等方面,优化post-training,让大模子的潜力发作。
Agent:实现方式(之一)是做更多数据标注、研究to use agent相干。
多模态(Qwen-VL):非常智能的模子应该融入对视觉、语音方面的明白,本年会重点关凝视频模态的研究,思索怎样打造一个VL-Agent。




高通万卫星:具有异构盘算体系的高通AI引擎可以充实满意天生式AI的多样性要求
高通公司AI产物技能中国区负责人万卫星在演讲中表现,作为芯片厂商,高通正通过提供领先的产物息争决方案,推动AIGC相干财产的规模化扩展。
他指出,高通以为终端侧天生式AI的期间已经到来。




高通在客岁10月发布的第三代骁龙8和骁龙X Elite两款产物中,已经将大语言模子完备搬到了端侧,赋能了浩繁AI手机和AI PC。多模态趋势下,本年2月,高通也把多模态大模子完备地搬移到端侧。在发布的骁龙X Elite这款产物上,高通也演示了环球首个在Windows PC上运行的音频推理多模态大模子。
万卫星表现,差别范畴的天生式AI用例具有多样化的要求,背后所需的AI模子也是千差万别,很难有一种处置惩罚器可以完善实用全部用例。
在这方面,高通推出了具有异构盘算体系的高通AI引擎,包罗多种处置惩罚器组件,可以充实满意天生式AI的多样性要求。此中重点讲了NPU。基于用户需求和终端用例的多年演进,高通NPU不停升级。第三代骁龙8的Hexagon NPU还集成了专门为天生式AI打造的Transformer加快模块,以及微架构升级、独立供电轨道、微切片推理等先辈AI技能。
万卫星还透露高通本年会重点支持多模态模子端侧化,以及支持更高参数目大语言模子在端侧的摆设。
说完硬件计划,万卫星先容了高通的紧张AI软件产物,包罗跨平台、跨终端的同一办理方案高通AI软件栈(Qualcomm AI Stack)。
你只必要在高通一个平台上完成模子的优化摆设工作,可以非常方便的把这部门工作迁徙到别的高通产物线。
别的,高通还在本年的MWC巴塞罗那发布了高通AI Hub(Qualcomm AI Hub)。该产物面向第三方开辟者和互助同伴,可以资助开辟者更加充实的使用高通和骁龙底层芯片的硬件算力,开辟出本身的创新AI应用。
末了他总结了高通在AI方面的上风,在于“无与伦比的硬件计划、顶尖的异构盘算本领、可扩展的AI软件工具以及广泛的生态体系和模子支持”。
蚂蚁李开国:超70%代码题目单纯靠基座模子是办理不了的
超70%的题目必要端到端代码天生本领办理,现在单纯靠基座模子还远远不能满意。
在中国AIGC财产峰会上,蚂蚁代码大模子CodeFuse负责人李开国如许说道,他还指出,当前代码大模子固然在基座模子和应用产物上演进飞速,但要在企业中真正实现研发服从的大幅提拔,仍面对诸多挑衅。




从软件研发全生命周期来看,从最初的需求计划到编码开辟、测试构建、发布运维、数据洞察等环节,写代码大概只占1/5乃至更少的工作量。
李开国表现,蚂蚁团体盼望打造一个“研发智能体”,通过智能Agents实现使命分发与衔接,将各环节毗连起来,全面提拔研发效能。
CodeFuse刚发布时,就明白提出“要做全生命周期的代码大模子”。CodeFuse现在已开源13个堆栈,覆盖代码练习、测试、DevOps运维、步伐分析、评测等8大软件开辟范畴。李开国表现,这是全方位的开源。
末了再来看整个范畴,联合外部统计与蚂蚁实践,基座模子在现实运用过程中只能办理约莫30%的题目,剩下70%的题目还必要端到端代码天生本领。除此之外,在Agent推理本领、需求需求拆解、跨模态交互等方面还必要连续演进。
李开国还重点提到,垂直场景中,好比金融场景,天生代码的安全、可信、可靠的要求,这也是蚂蚁正在重点攻克的困难。
固然挑衅不少、道阻且长,但李开国以为,蚂蚁将携手开源社区一起积极,在万物摩尔定律的牵引下,将来两三年可以肯定水平办理这个题目。
小冰徐元春:市场真正的运营主体黑白常质朴的
小冰公司团结首创人兼首席运营官、人工智能创造力实行室负责人徐元春的演讲主题是“数字人+大模子:打造贸易应用新场景”。
“作为一家算法公司怎么挣钱和作为一家AIGC财产公司怎么赢利,这是末了要答复的题目。开始要答复的题目是,各人用这个东西怎么赢利?”,徐元春如许讲。




他通过几个特殊详细的例子,显现了小冰是怎样让各人赚到钱的。
第一个是一个美装美业个体博主,她使用小冰假造人和大模子平台,创作出了本身的数字人,在短视频平台用数字人分因素享创作服装穿搭内容。仅用40多天,她的单条视频播放量就到达200万,日均为线下门店引流6-8个意向客户。而这,已经能让她的买卖更好地发展起来。
第二个是一家中小型的企业,一开始是做软件开辟、技能赋能、背景的支持,如今利用小冰的技能平台做转型,成为AI服务商,4个月内为云南300家中小企业提供了AI赋能服务。
第三个是更大的行业领军企业,他们将小冰的数字人与大模子技能深度整合到了自家各类硬件产物中,实现“开箱即用”,每一个有屏的硬件装备都可以酿成一个全新的交互载体。
在徐元春看来,真正能把财产化应用做得越来越深,不在于庙堂之高,而是在江湖之远:
你发现真正市场在运行的主体、市场从业者对AI没有那么多复杂的想法,他们非常质朴。
他进一步增补道,小冰将大模子和数字人更加深入地植入到了企业的工作流和使命体系中,数字员工相称于有了聚集企业知识和数据闭环的大脑,可以让业务流程和客户沟通更加顺畅。
末了徐元春报告了贸易的闭环。有“云+端”如许的软件+硬件产物的闭环,也有交互+内容如许的情势上的闭环。而本日通过真实的企业、个体案例,利用技能去得到更多竞争力、让本身的买卖变得更好这实在是全部闭环里最紧张的节点。
“找到并激活每个关键节点,才气实现技能贸易化的真正闭环。”
AIGC应用层:平凡人可以怎么AI?
美图吴欣鸿:基于垂直场景的大模子应用创新,窗口期只有两年
美图公司首创人、董事长兼CEO吴欣鸿则分享了美图视频大模子的探索之路。




美图作为影像工具发迹,颠末16年的发展,如今重要聚焦在影像和计划产物,形成了图像、视频和计划三大AI产物品类。
吴欣鸿现场展示了一个仅用半天时间制作的60秒AI短片,运用了开拍、WHEE、Wink等一系列AI工具,相比传统动画工作流,大幅低落了制作门槛,提拔了服从。
吴欣鸿预计本年下半年,将会有许多的国产Sora扎堆上市,美图也是此中的一家。
我们以为越来越猛烈的竞争有三个点非常关键:第一、创意逾越实际;第二、工作流的整合;第三、垂直场景的本领。
此中基于垂直模子的大模子应用创新,吴欣鸿以为有两年窗口期。
预测将来,吴欣鸿以为,视频大模子的标配除了文生视频,还将涌现图生视频、视频生视频、音频生视频等更多天生方式,应用场景非常广阔。
本年,以Sora为代表的视频天生只是个开始。随着视频大模子对物理天下明白的加深,有望实现剧情计划、分镜、转场等更专业的本领,与视频制作工作流深度联合,后续可以天生1-5分钟视频。
金山办公姚冬:WPS已不再是一个文档编辑器
金山办公副总裁、研发中台奇迹部总司理姚冬在本次大会上分享了金山办公在拥抱AI海潮中的思索与实践。




作为一家办公软件公司,金山办公近来五年将“多屏、内容、云、协作、AI”作为战略重点,在AIGC海潮下,近来两年尤其注意AI和协作这两点的发展。
就在前几日,金山办公发布企业级产物WPS 365。
姚冬表现,当前的WPS已经不再是一个文档的编辑器,而是包罗企业数据协作、知识管理、通讯以及各种跟算法相干的模子服务等多种功能于一体的办公平台。在近来WPS 365发布中,其包罗的WPS AI企业版聚焦为客户打造企业大脑,主打三大类本领:AI Hub、AI Docs和Copilot Pro
此中,AI Hub是企业利用AI本领的基座,提供了一个兼容市面上各种大模子的同一接口和开辟体系,让企业可以机动选择和切换得当本身的模子。
AI Docs是用来资助企业盘活海量非布局化数据资产。
员工天天都在写文档,这些实在是企业非常紧张的只是。但已往不停有个题目,这类知识无法再使用,由于非布局化。
传统的关键词搜刮很难正确掷中文档中的知识,而基于大模子和多模态技能,WPS 365实现了对企业内部各种格式文档的智能化阅读明白、搜刮问答,并严酷遵照文档权限管控。
Copilot Pro则是通过AI驱动天然语言交互式办公。好比做数据分析,传统方式必要写脚本、计划公式、绘制图表等,门槛很高。在Copilot Pro中,用户只需用天然语言表达需求,让AI主动实行全流程。
姚冬夸大,文档数据在人和人之间没有流传实在一个数据孤岛,而本日的办公不再只是简朴写写文档分析数据,更紧张的是人和人、人和AI之间的协作。
印象条记唐毅:AI驱动的“第二大脑”,既给用户自由,又低落信息管理焦急
印象条记董事长兼CEO唐毅,有科技创业、跨国企业管理以及投融资范畴的丰富履历。
他领导的印象条记,2018年建立印象研究院,开启了对AIGC的探索,客岁3月起,使用自研印象大模子驱动“印象AI”产物和服务,落地赋能旗下全线软件和智能硬件产物。




唐毅的分享聚焦“知识管理”范畴。在他看来,AIGC的发展仍处于早期繁荣阶段,挑衅和机会并存。
他以为,相比算力、数据集和模子规模的快速扩大,模子算法的希望则相对迟钝,且算力的投入和收益不成比例。别的,现在而言,随着模子练习对人类公共范畴数据的穷尽,越来越多合成数据的参加也会导致模子输出结果降落。
与此同时,在实践和竞争中发现,特定命据驱动的模子本领的增长在不停增强,模子的小型化和高效化趋势也日益突出。
谈及印象条记的大模子及产物进化方向,唐毅表现将从复合AI体系(Compound AI System)角度出发,提拔自研印象大模子的本领,同时发挥用户、数据、场景、载体、交互等方面上风,打造真正的AI超等应用。
在AI驱动下,印象条记将资助用户智能汇聚信息、高效阅读吸取、辅助灵感记载与创作、主动完成知识整理与提炼,成为用户真正的、智能的“第二大脑”。
逐际动力张力:人形呆板人将来将实现平台化应用
通用呆板人初创公司逐际动力的团结首创人兼COO张力,在中国AIGC财产峰会现场分享了关于人形呆板人发展及其与AGI关系的深刻看法。




现在,人形呆板人的双腿移动本领已经有了实质性突破,而操纵本领仍旧受限,是由于AI还不能完全根据多模态场景形成本身的举动,怎样使用多模态大模子天生呆板人自主的活动和控制,是财产界和学术界都在追赶和研究的部门。
在硬件和软件算法方面,尤其是大脑和小脑的协同上,人形呆板人仍需取得更多突破。
张力畅想,将来的人形呆板人可以实现平台化的应用,就像本日的iPhone+APP一样。呆板人通过安装差别的应用步伐,使用自身的活动控制本领,实行对应的各种使命,从而极大地扩展应用范围。
从本质来讲,呆板人就是一个雷同大概逾越人活动本领、盘算本领和感知本领的机电体系。技能方面,事先规划好的活动控制这种是相对传统的技能;而假如必要跟外界产生更多的交互,如情况认知感知、物体检测、打仗反馈等,就必要新的技能。在这方面,AGI对于呆板人的影响非常大
在不停研发迭代产物的过程中,逐际动力形成了通过模拟学习、深度强化学习以及基于感知的活动控制等关键的新技能,推出了人形呆板人、双足呆板人,以及四轮足呆板人。
张力分享了他对人形呆板人市场远景的见解:
无论tob照旧toc,具身智能在将来有非常大的应用场景。
在技能界限不停扩大过程中,怎样通过沿途下蛋,把相对成熟的技能和产物实现贸易化;形成自主的移动本领和移动操纵本领是关键;呆板人与AGI、AIGC买通,增强场景的认知、明白,实现使命的分解,更好完成规划决议,这些都非常紧张。

得到快刀青衣:AI给了许多人一个突破本身的时机
得到团结首创人、AI学习圈主理人快刀青衣的演讲主题是“六边形兵士,AI 驱动下的个人本领革命”。
“六边”在快刀青衣这里指的是产物本领、输出本领、提效本领、创新本领、管理本领、计划本领。在他看来,AI技能的发展让他个人的六边本领得到全面提拔。




他从创新和输出两方面分享了已往一年的心得。
起首,快刀青衣以为,AI创新的源泉可以从四个方面思量:你本身也想用的产物、一个困扰你好久的痛点、你认识行业能预见到的巨大变革、你对它布满热情而又具有挑衅性的事变:
假如四项占两项就可以干,占三项就非常值得你花许多时间去研究它。
以此为出发点,快刀青衣先容了得到自主研发的AI陪练小步伐“开始练练”,用来给员工举行AI实战陪练,收到AI的反馈。云云一来,训练后的员工再面临真人客户时就能轻松解答客户的题目。
接着他分享了开辟这款小步伐的初志。一开始是想让本身公司的步伐员用,厥后步伐员们都表现本身不是靠沟通干活的,是靠写代码。厥后有一次发朋侪圈,一个连锁美容院的老板发现这对他们一线美容师先容产物特殊管用……
快刀青衣由此感慨,“最初谁人出发点大概跟你想象的不一样,过程中大概会有许多不一样的东西”。
别的,他还夸大了企业专有知识库、专有数据的紧张性,并表现本身在做这个AI项目时给团队设置了几个限定:团队不凌驾3人,缺的本领用AI补;不碰硬件,不训大模子;只做提拔用户本领的培训场景。
认清本身本领,做本身更善于的事变,不能由于AI本领强就以为啥都醒目。
输出本领提拔方面,快刀青衣分享了本身从公众号年更“包管号不被冻结”到365天日日更的变化,以及每周都要做一场和AI有关的直播聊一下别人都在做什么。这统统都是这波AI海潮给他带来的输出本领的提拔。
末了,快刀青衣引用了乔丹的一句话:“我可以担当失败,但不能担当不去实验。”
AIGC基建层:怎样支持财产数字化转型?
亚马逊云科技王晓野:四个要点让企业捉住天生式AI机会
天生式AI这个期间已经开始,它并不是将来将发生的事变。
亚马逊云科技大中华区产物部技能总监王晓野在演讲中表现,天生式AI将在18个月内颠覆全部财产,为环球带来高达4.4万亿美元的巨大市场商机。




对于企业怎样捉住天生式AI机会,王晓野总结了四大要点:选对场景、选对工具和互助同伴、器重数据这一企业焦点竞争力、关注人才造就与AI相干的羁系与管理。
他指出天生式AI在跨语言沟通、贸易决议以及洞察、智能服务和营销素材的天生、团体运营服从提拔等六大场景大有可为。
王晓野指出,得益于模子本领和本钱的优化,天生式AI正在从范围的文生图、营销、谈天呆板人等低级应用,进化到更广泛的范畴。好比在Claude等大模子支持下,语言翻译、情绪伴随、游戏内容考核等更多场景的落地正在寂静发生。他夸大多模态交互将是大模子发展的紧张趋势。
在助力企业应用天生式AI方面,亚马逊云科技提出了“三层原子本领”:底层底子办法加快层、使用底子模子构建天生式AI应用的工具好比Amazon Bedrock、顶层开箱即用的天生式AI应用。
从电商到云盘算,亚马逊不停在用技能和AI颠覆和创新原有财产。王晓野末了表现,下一个亚马逊正在构建而且连续投入的地方,就是天生式AI的三层原子本领,盼望能与客户共赢天生式AI期间。
商汤杨帆:打造AI底子办法生态是低落AI应用门槛的关键
“中国AI应用正在变得越来越多,越来越多新的场景被打开,本年下半年或是来岁上半年,我们将看到中国天生式AI市场的发作。”
商汤科技团结首创人、大装置奇迹群总裁杨帆在大会上做出了如许的判定。




杨帆分析道,当前标准定律仍在主导AI的技能迭代,AI财产发展的焦点题目在于“财产端的投入产出比不敷好”。随着AI生产和应用本钱的进步,用低落本钱的方式低落利用门槛实在是一定趋势。
AI底子办法的建立,正是破解这一困难的关键
只有把这些通用本领,不管大规模的算力集群照旧呆板模子的API,乃至将来围绕超大规模数据完备的体系,把它做尺度化、底子办法化、服务化,才有大概在将来让整个AI财产创新门槛更低、性价比更高,更多人进来,在上面赚到钱。
关于商汤在这方面的投入,杨帆先是先容了商汤在临港投建的智算中央的最新的希望:
停止客岁底,包罗临港在内已经建成七八个节点形成毗连,另有许多新的节点在建。毗连算力凌驾12000P,领先单点算力靠近10000P。同时,商汤在芯片层面也与财产链睁开了广泛互助,临港智算中央已有超15%的国产芯片算力。
夯实算力底子之外,杨帆还报告了商汤推出的差别层级的软件产物和服务体系,此中提到了低落模子调用本钱的全套办理方案。
他还分享了商汤自家大模子的发展,除了客岁看到比力多的语言类的使命,如今更多在图像、视频、三维重修差别范畴提供差别底子模子的方案。
总的来讲,商汤照旧更盼望以底子办法平台化本领支持更加繁荣的场景生态。
AIGC洞察者:Scaling Laws是关键
北大袁粒:大模子幻觉题目,我们险些是公开最早提出检索加强来办理
北京大学深圳研究生院助理传授袁粒在大会上分享了他们团队在多模态模子垂直范畴应用的实践履历。




他表现,用来闲聊的玩具并不能满意用户真正的需求,AI必须转化为实着实在的生产力,而生产力则是由垂直范畴来转化。
袁粒传授先容了他们团队基于鹏城的云脑和自建算力,基于通用和行业数据开辟的几款代表性产物:
ChatExcel:一款面向数据表格处置惩罚的多模态AI助手,可用笔墨直接利用表格,举行数据可视化和营销计谋分析等。这项结果已经在某奢侈品巨头落地应用。开辟这块应用的博士生也开办了元空AI。
ChatLaw:中文法律垂直范畴应用,可为用户和状师提供信息分析、布局化抽取、天生法律文书等服务。该产物接纳了检索加强技能,引入法律文本数据库参考,有用缓解了大模子的幻觉题目。
检索加强这一做法其时我们也是业内最早做出来的,只是我们没有把这个概念提出来,让大模子做大模子的事变,让检索做检索的事变。
末了袁粒传授先容了他们同北大校友企业兔展智能团结发起的Sora复现开源筹划Open-Sora Plan,目的是实现一个视觉版LLaMA。该项目分为三个技能部门:视频编解码器、Diffusion Transformer和条件注入。
现在已经开源了第一版预练习模子和CausalVideoVAE,在开源社区引起广泛关注,在GitHub上得到近万星。该框架最大特点是可以或许天生较长视频,得益于练习时压缩喂入的长视频片断。
接下来,该项目将分三个阶段实现更高的复现目的:第一阶段已开源;第二阶段夺取开源支持20秒720P视频天生的模子;第三阶段盼望借助财产界算力实现逾越原版Sota的性能。
袁粒传授表现,开源推动了AI的繁荣,他们也盼望通过开源回馈社区,让学术界和财产界都能共享技能结果。
硅谷Fusion Fund张璐:初创企业在现阶段都可走“鸡尾酒”模式
作为恒久关注和结构AI范畴的顶级投资人,硅谷Fusion Fund首创合资人、斯坦福大学客座讲师张璐分享了她对环球尤其是硅谷AI技能与财产发展的深度洞察。
张璐指出,AI正在成为一项全财产的数字化转型工具,而海量高质量数据的涌现为AI的大规模应用奠基了底子。
在此配景下,AI将带来比互联网期间大10倍的时机,但此中只有三分之一会留给初创企业。
作为初创企业,找到对的工业界和对的应用场景,找到符合的切入点非常关键,数据是焦点。怎样拿到高质量的数据?怎样让数据成为你的竞争上风点?
初创企业要想在AI海潮中捉住先机,必须找准自身的创新切入点,充实使用大公司搭建的生态平台实现共同发展。
现阶段,初创企业根本上都可以做“鸡尾酒”模式,即变更最前沿大模子的API,在上面配套利用开源模子,再本身做些修改举行模子调优。
“在这个优化过程中,很快会发现两个特点。”张璐说,第一个特点是数据的质量比数据的数目更紧张;第二是不必要一个模子去办理全部的题目。




在投资方向上,张璐表现,Fusion Fund聚焦AI的应用层底子办法两个维度。
此中,应用层重要关注医疗、金融保险、呆板人、太空等拥有海量高质量数据和广阔应用远景的范畴;底子办法层则结构从芯片到云端的各个技能节点,旨在突破算力、能耗、隐私等AI发展的关键瓶颈。
张璐在演讲中谈到,随着开源社区的发达发展,小模子、行业专属模子也将成为AI应用的紧张趋势。
她夸大,对于创业者而言,高质量数据的获取与应用比海量数据更为关键,定制化的小模子在特定场景下的效能乃至可以与通用大模子相媲美。
人大卢志武:有算力就有逾越Sora的大概
中国人民大学高瓴人工智能学院传授卢志武分享主题为《VDT:基于Transformer的通用扩散视频天生》。
VDT是Video Diffusion Transformer的缩写。这是卢志武带队的项目,客岁5月发布在arXiv上,并已被顶会ICLR吸收。
它的创新之处是将Transformer应用于视频天生——这远在OpenAI发布Sora之前,以及在模子中引入同一的时空掩码建模。




为什么要将视频天生从基于Diffusion模子转向基于Transformer模子?
卢志武表现,Transformer模子具有捕获恒久或不规则时间依靠性的上风,这在视频范畴尤为紧张;而Transformer模子的参数目可以根据必要增长,这为进步模子性能提供了机动性。




在演讲中,卢志武提到了VDT模子中关键的时空Transformer block,并表明了其与现有模子如Sora的渺小差异。他指出,由于算力限定,团队在计划时接纳了空间和时间分开的处置惩罚方法,以进步服从。
那VDT与Sora如许的SOTA模子相好比何?卢志武分析,两者在时空Attention处置惩罚上有所差别,但这个差异并不是本质上的。
我们推测Sora强盛的物理天下模仿本领,重要来自于同一的时空token化和Attention机制。
卢志武在末了表现,团队通过实行发现,VDT模子结果只和斲丧的算力有关,这与OpenAI的图像天生模子DiT的结论同等。
“算力越大结果越好。拿到更多算力,逾越Sora也不是不大概。”
圆桌对话:ROI是权衡AIGC应用代价的第一尺度
“你好,新应用!”峰会设置了一场圆桌论坛,讨论的主题非常务实:怎么落地?怎样赢利?
——从ChatGPT问世到如今,一年半的时间里,AIGC有一个非常显着的趋势,就是从建立底子层渐渐向“用起来”去发展。本年也被许多人以为是AIGC应用元年,在这个时间节点上,有须要坐下来聊一聊与AIGC相干的接地气的话题。
本次约请到的三位代表性高朋分别是:
轻松团体技能副总裁高玉石,主导了该团体在康健保障范畴的AI智能体系研发建立。




阿里云通义大模子业务负责人徐栋,在云原生、端云架构和AI大模子范畴的深入实践。




在AI和企业服务范畴积聚了名贵履历的澜码科技首创人兼CEO周健




在量子位主编金磊的主持下,圆桌重要围绕3个话题睁开:大模子应用用得怎么样了、AI赢利之道各有招、百模大战利大于弊。
大模子应用用得怎么样了
高玉石表现,轻松问医Dr.GPT的升级给医患两边都带来很大便利。在大夫端,临床研究的服从提拔2倍;科普内容创作实现月产万篇规模;智能辅助诊疗的采取率达86%,诊断时间从非常钟收缩为1-2分钟。患者端的康健顾问覆盖30多万用户,活泼率70%。
周健的澜码科技基于大语言模子打造企业级AI Agent,服务于企业一样平常办公场景下的加强主动化和创新业务的开展,在保险、银行、政务等行业和范畴已实现专家知识赋能下层员工和管理增效的典范应用。
徐栋从通义大模子的视角给了两个维度的观点,现在看到第一类是大模子塑造了财产的焦点贸易模式,好比游戏行业的NPC、交际范畴的脚色饰演,以及像智能硬件端侧的应用;第二类是企业级市场,未必是对贸易模式做了根天性重塑,但大模子突出表现在降本增效上,最典范的客服场景、知识库的问答等等,这些场景在企业内部提效资助很大。
AI赢利之道各有招
在AIGC贸易化方面,徐栋表现现在AIGC应用尚未出现杀手级产物,将来大概出现基于订阅制的创新贸易模式,可以拭目以待。
高玉石则表现他们重要通过为C端用户提供增值服务赢利,如医疗康健类的保险、商城、科普付费等。对B端则重要是按需付费。
周健提到一种大概性是把AI Agent/基于大语言模子的数字员工按月收费。将专家知识、模子、算力等全新生产要素整合为一套服务,面向金融等行业按利用量收费分成。
对于怎样评判一款AIGC产物的代价,三位高朋同等以为要看其可否提拔ROI,包罗降本增效、进步收入或改善用户体验等。但详细权衡方式要根据行业和场景特点而定。
百模大战利大于弊
针对客岁百家争鸣的“百大模大战”是否有须要,高玉石以为从加快技能发展角度看是有代价的,但资源消耗题目必要留意。他预判终极大概在科技巨头及其投资的创企中睁开洗牌。
周健提出,将来通用大模子大概只必要少数几家,但细分的垂直范畴模子大概多达上百个,必要更多创业公司到场。
徐栋也以为,“百模大战”并非完全浪费浪费,它造就了人才队伍,积聚了模子和数据方面的履历,我们也接待非同质化的模子的竞争,这些造就的人才、积聚的履历也会资助大模子落地到千行百业,对将来AIGC的贸易化大有裨益。
后续还将有大会高朋更具体版内容分享,恣意关注!
您需要登录后才可以回帖 登录 | 立即注册

Powered by CangBaoKu v1.0 小黑屋藏宝库It社区( 冀ICP备14008649号 )

GMT+8, 2024-12-23 10:31, Processed in 0.190444 second(s), 33 queries.© 2003-2025 cbk Team.

快速回复 返回顶部 返回列表