阿里云CTO谈大模子开闭源之争：模子应用不能只对接一个情势 ...

日向￠宁次 · 2024-5-14 14:26:44

界面消息记者 | 肖芳
界面消息编辑 | 宋佳楠

5月9日，阿里云正式发布通义千问2.5，并称在中文语境下，模子性能全面赶超GPT-4 Turbo。相比于通义千问2.1版本，通义千问2.5的明白本领、逻辑推理、指令遵照、代码本领分别提拔9%、16%、19%和10%。
当前行业对大模子的关注除了各项参数自己，有关开源与闭源门路之争也成为一大核心。谈及此话题，阿里云首席技能官周靖人在担当界面消息等媒体采访时表现，模子之上的应用和创新非常多，不能仅仅范围于利用某一款闭源的框架大概说只能对接某一个情势。
在他看来，不管在PC端照旧手机端，大模子可以适配各种各样的场景，可以或许快速搭建更加复杂的业务，而这必要一个非常开放的开源生态去对接，环球开辟者以及环球企业都在拥抱如许一个体系。
和周靖人的观点所差别，百度CEO李彦宏在本年4月的一次内部发言中表现，闭源模子在本领上会连续地领先，而不是一时地领先。模子开源也不是一个众人拾柴火焰高的环境，这跟传统的软件开源，好比Linux、安卓等很不一样。
李彦宏以为闭源是有真正的贸易模式的，是可以或许赚到钱的，赚了钱才气聚集算力、聚集人才。
在李彦宏表达其见解之后，多位互联网大佬给出了本身的判定。好比，360公司CEO周鸿祎表现，不停信赖开源的气力，将来一两年内，开源的气力很有大概会到达大概凌驾闭源的程度。着名投资人朱啸虎则称，开源小模子一定是将来方向，且贸易时机许多。
大模子开源和闭源的门路之争，本质上是在探究开辟者可否资助大模子举行迭代升级。
大模子的开源和软件开源是完全差别的逻辑，开源软件由于代码完全公开，社区开辟者可以到场迭代，不停提拔软件本领。但开源模子像一个“黑箱”，不管是模子、算法照旧数据，都无人知晓，只是终极产生一个模子开放给用户利用。在一些对峙闭源逻辑的厂商看来，开辟者到场对大模子迭代资助不大，开源大模子和开源软件是两回事。
对此，周靖人表现，整个开源的开辟者生态对技能发展的贡献毋庸置疑，这也是他对开源生态根本的判定。
他指出，大模子带来的潜力还没有被真正发掘出来。现在有许多企业是联合自现实的开辟场景和业务需求去做，将来还将有一个翻天覆地的变革。在这个时间点，阿里云盼望可以或许以开放的心态把先辈的技能开源出来，让各人做并行探索。
阿里云公布的最新数据表现，通义大模子通过阿里云服务企业超9万，通义开源模子累计下载量突破700万。
通义大模子已经在PC、手机、汽车、航空、天文、矿业、教诲、医疗、餐饮、游戏、文旅等多个范畴落地，阿里云对峙的开源生态也不但限于大语言模子范畴，还包罗视觉模子、声音模子。好比，中国科学院国家天文台人工智能组基于通义千问开源模子开辟了新一代天文大模子“星语3.0”，这是大模子初次应用于天文观测范畴；陕煤建新煤矿等十余座矿山推出由通义大模子支持的新型矿山庞大风险辨认处理体系，成为大模子在矿山场景的初次规模化落地。
另据界面消息相识，固然阿里云不停对峙开源模式，但其也在结构闭源模子。现在无论是开源模子照旧闭源模子，大模子平台还未靠大模子自己实现红利。从亚马逊等国际互联网巨头的实践也可以看出，他们是在通过出售搭载大模子本领的云服务赢利。
有分析以为，阿里云现阶段夸大对峙开源，目标不但仅是开源自己，而是通过开源把大模子本领做强。
阿里云方面也在故意夸大通义千问的本领。除了通义千问2.5在中文语境下模子性能全面赶超GPT-4 Turbo之外，通义还发布了最新款开源模子——1100亿参数的Qwen1.5-110B，据称该模子在MMLU、TheoremQA、GPQA等基准测评中逾越了Meta的Llama-3-70B模子。

阿里云CTO谈大模子开闭源之争：模子应用不能只对接一个情势 ...

所属分类: 问答交流

新帖推荐: 30日

推荐作品