(相关资料图)
“决战大模型胜负的关键,到底是什么?”作者 | 何思思 编辑| 张 进
“一定程度上,美国的算力禁用会造成国内大模型发展的限制,因为没有核心算力就没办法训练模型。”之于算力对于大模型的重要性,优刻得董事长兼CEO季昕华如是说。
自今年2月份大模型在国内火出圈后,算力瞬间成了业界最关注的话题,也成了国内大模型训练很难攻克的关卡。其实从另一个角度分析,算力的爆发式增长也给国内的云计算厂商带来了空前的发展机遇。 对此,季昕华也表示认同。他表示,算力禁用是坏事也是好事,一方面,如果想在一两年内解决卡脖子的问题,需要加快国产芯片的研发速度,这并非一件易事;另一方面,企业越来越重视算力,这样反而会推动国产芯片的发展。 作为中立的云计算厂商,优刻得其实很早就感受到了大模型竞争的背后,算力市场将会迎来巨大的变化。 “去年11月份第一次接触到Stable Diffusion,当时就觉得它的效果非常惊艳,所以就开始关注大模型了。”季昕华向雷峰网表明了关注大模型的缘由,同时他还透露道,由于当时中国企业还没开始关注大模型,也不知道它到底能创造多大的价值,所以当时并没有下定决心做大模型相关的业务。 而真正让优刻得应用大模型和服务大模型企业要从今年2月份说起,这也是大模型在国内出圈的时间节点。 雷峰网了解到,优刻得首先基于大模型研发了知识问答平台“识问”、UCoder代码助手平台,AI绘画助手平台、大模型安全管理平台四款供内部使用的AI产品,其次,基于低成本、高附加值的自建数据中心,优刻得打造了AIGC算力底座,为大模型的训练、推理、数据处理等灵活提供多款GPU算力资源。 紧接着,优刻得推出了私有化大模型一体机,内置优刻得自主研发的UCloudStack全栈私有云平台,提供虚拟化、存储、网络及MaaS模型的私有化方案,结合行业垂直大模型一体化交付给客户,企业可一键部署大模型应用。 之于优刻得在大模型时代的定位,季昕华再次强调了“中立”的原则。他解释道,中立代表优刻得不仅和客户之间没有竞争,而且要帮助大模型公司找客户。对此,季昕华还曾公开调侃道,大模型时代,优刻得要做的是“红娘”。 从季昕华的回答中,我们也能间接得出优刻得内部研发、应用大模型产品的原因,一是为了公司员工了解大模型、学会使用大模型,在这基础上,才能深入地了解大模型的痛点是什么,具体能在哪些场景落地,这样才能更好地为客户提供服务。 谈到大模型的未来,季昕华表示,未来具有太多不确定性,但不管怎样,互联网行业或者人工智能行业都是需要算力的,目前国内无论是单卡的训练能力,还是卡之间的互联能力都是有限的,所以优刻得未来的工作重点是把大模型算力底座搭建好。
以下是雷峰网和季昕华的对话:01竞争大模型不是有卡就能躺赢
工程能力对模型训练至关重要
雷峰网:很多人都在说最终能参与到大模型这场竞争的只有少数几家云厂商,像高速网络就不是每家都有,您认为竞争的壁垒到底是什么?季昕华:是这样的,像高速网络这样的技术并不是竞争大模型的主要门槛。包括优刻得及大多数云厂商都有能力做。现在网络有两种结构:第一种是RoCE的网络,这方面优刻得在 2019 年就已经有这个能力了。 第二种是IB网络的方案,这是英伟达推荐的方案,这个方案相对来说更简单,只需要部署和维护。所以对云厂商或者体量特别大的公司来说,技术不是主要的门槛。
雷峰网:其实现在有说法说很多大模型企业都开始囤卡了?季昕华:是的,尤其是一些大厂都在囤卡,包括A800、H800等。一方面自身的AI业务需要用到卡,加上有更多的资金投入,在此前就会购入大量的卡;另一方面,国内大范围关注大模型是在今年的2月份开始,各个厂商因为重视,也会加快囤卡的速度。
雷峰网:那是不是拥有的卡越多就能躺赢?其他云厂商怎么和大厂竞争?季昕华:也没有躺赢,很多AI大模型公司现在也在用我们的卡,这种现象很普遍。 原因有几个:第一,只用一家的卡是不够的,第二,大模型公司为什么愿意和优刻得合作?是他们觉得大厂既有算力、算法,还有数据和场景,与大厂合作最终还是担心会存在业务竞争。而优刻得作为中立安全的云厂商,与大模型企业没有竞争。同时优刻得能够从数据中心、底层架构做到算力平台、模型库等,具有深厚的技术积累和一站式系统工程服务能力。
02做好算力服务
做好大模型“红娘”这个角色
雷峰网:优刻得是什么时候开始关注大模型的?季昕华:最早接触是去年国庆的时候,首先看到的是Stable Diffusion,当时觉得它的效果非常惊艳,就开始关注了大模型了,所以ChatGPT的话我们跟进的比较早。
雷峰网:所以去年国庆的时候就下定决心要做这件事了?季昕华:去年国庆之后,优刻得就把AIGC定为了今年的目标,去年11 月份还发布了AI绘画平台镜像。今年2月份和国内头部的大模型公司交流之后察觉到国内算力市场将有一个爆发性的发展,所以在3月底下定决心要做这件事儿。
雷峰网:在这些做大模型的企业中,有多少潜在客户?季昕华:我们总结了中国做大模型的公司有130家了,通用的有78家,垂直的有52家。而且还在持续增加,其中有30多家已经是我们的客户了。
雷峰网:具体以什么样的形式输出服务?季昕华:一是我们的算力,二是机房服务,因为有些公司是自己买设备然后放到我们的机房。
雷峰网:机房服务怎么理解?是客户本身没有运营能力吗?季昕华:企业本身不管在哪都需要机房,大模型所需的机房有两个特点:一是它的电量消耗大,二是比如一台 H100 的机器所需功耗超过10kW,一般机房是满足不了这种需求的,优刻得的乌兰察布数据中心就特别合适。另外,现在很多公司都存在有了服务器但用不起来的问题,那优刻得就可以帮助他们搭建一个算力平台并进行后续的维护工作。
雷峰网:除了提供算力外,优刻得前段时间还发布了“识问”?季昕华:优刻得内部做了四个平台:知识问答平台“识问”、UCoder代码助手平台,AI绘画助手平台、大模型安全管理平台。其实在“识问”之前,最早我们首先做的是大模型应用管理系统,这是我们的第一款产品,希望未来所有人都能够用上大模型; 第二为了解决商业安全问题,我们做了一些限制,包括你的提问、上传的文件,我们都会记录和过滤,防止公司机密信息在网络上泄露; 第三针对用户的问题,包括员工内部的问题和外部的沟通和返回,系统会做自动记录,方便后期公司持续进行自己的模型训练。
雷峰网:为什么做这四款产品?能对外吗?季昕华:一是为了公司员工都能了解大模型、使用大模型,在这基础上,才能深入明白大模型公司的痛点是什么、具体在哪些场景落地,这样才能更好地为客户提供服务。 这四款产品目前是公司内部使用的,但是如果客户有需要的话,我们也可以进行更多交流。
雷峰网:那这几个平台是基于哪个模型做训练的?季昕华:先用 GPT 4 训练,进行模型验证,走通后逐步再用国内的大模型或者开源大模型去优化。对此我还提了一个概念叫“国外磨枪、国内战斗”。
雷峰网:未来还有哪些场景是您比较看好的?季昕华:如果按照对ChatGPT输出内容不准确定性的容忍度来区分的话,我们划分了10个场景。 第一是翻译和配音,在这方面的能力已经非常高了,完全可以取代人类;第二是游戏的NPC;第三是社交;第四是电商的内容输出;第五是游戏设计;第六是客服;第七是公文和编程的辅助;第八是企业内部的知识管理,第九是教育场景和保险场景,最后是辅助律师和医生的工作。
雷峰网:这10个场景会同时做吗?还是逐步推进?季昕华:优刻得不做大模型,我们只是把客户和合作方对接起来,可以理解为“红娘”的角色。比如把游戏客户对接给MiniMax、把电商、教育行业的客户对接给智谱华章。
03国内大模型水平赶超GPT4很难
创业公司机会更多
雷峰网:您认为国内大模型公司可以分为几类?哪些是优刻得的重点客户?季昕华:我们分为五大类。第一类是巨头,包括阿里、百度、头条,华为、京东等。第二类是科学家创业的,像智谱华章这类公司;第三类是原来的AI公司、AI 四小龙、达观、云知声、第四范式等;第四类是创业公司,像MiniMax;第五类是原来的上市企业转行做大模型的,像昆仑、360,也包括王小川、李开复这些创业大佬等。 第一类大厂不是优刻得的目标客户,后面几类才是我们的重点客户。
雷峰网:也就是说大厂有自建能力,其他企业是没有自建能力的?季昕华:因为涉及到人工智能领域,所以不仅是网络问题,还有存储、机房等一系列问题,例如创业公司也可以自建算力,但周期会很长,等他自建好之后,竞争就结束了。大模型比拼的就是速度,谁速度快,谁就有可能占领制高点。
雷峰网:对于大厂说,大模型分为几个阶段,几个节点?季昕华:第一是大模型上线,第二是上线后效果的验证。目前了解到上线的有MiniMax、智谱、百度、阿里、科大讯飞等公司。
雷峰网:哪家的效果好,主要看算力用的多少吗?季昕华:我不这么认为,训练用的算力多不一定能训练出好的模型,但如果推理环节卡用的多的话,说明用户量大,得到的反馈也就更多,更有利于训练出好的模型。
雷峰网:不管训练还是推理,做大模型首先还要有算力的?季昕华:对,第一要有卡,如果没卡的话肯定是落后的;第二要具备很强的工程能力,有了卡用不起来也不行,目前各家的工程能力发挥都在40-50%左右。以上两个问题都解决了,就是安全问题了,另外流量问题也很重要。
雷峰网:国内模型到什么水平了?很多人说今年年底能追上GPT4。季昕华:目前国内还没有出现超过GPT3.5的模型,当然在某个方面超过其实很容易。超越GPT4的话很难,关键在于GPT3.5之前的论文是公开的,但是GPT4还没有公开,所以大家都不知道该怎么做。
雷峰网:国内这些大厂也没有机会赶超吗?季昕华:我觉得现在大厂的效果都不如创业公司。因为有些有信念、有理想的创业公司早就开始做了,大厂实际上是看到ChatGPT火了之后才做的。
雷峰网:按理来说大厂有技术积累,不更有机会吗?季昕华:AI有很多方向,以前大部分企业都认为垂直大模型有机会,不认为通用大模型有机会,所以过去几年真正做通用大模型的反而是一些有信念的创业团队和科研团队,比如智谱华章、MiniMax,中科院等。 那对大厂来说,更多的是看到国外在做这件事后进行跟进,并没有上升到公司战略,因此他们在通用大模型方面并没有特别多的积累。
雷峰网:算力问题迟早会解决,那优刻得在大模型方面的优势是什么?季昕华:总结为三点:第一保持中立性,和用户是没有竞争关系的。第二具备数据中心、网络以及数据存储的一整套AIGC解决方案构建能力,能帮助中小型公司快速搭建平台,解决使用大模型的效率问题;第三能更好地帮助大模型公司拓展客户。
048月14日
一次与季昕华面对面交流的机会
今年2月份到现在,大模型在国内火了已经将近半年的时间,这段时间国内涌现出了各种各样的通用大模型和垂直大模型,参数量也是千差万别,可以说国内大模型已经进入到了白热化阶段,相对应的算力竞争也愈演愈烈,但是伴随着国内对算力的重视程度越来越高,被卡脖子的阴谋论终将被粉碎。
接下来的一周,在8月14-15日,一群人工智能开拓者将齐聚新加坡乌节酒店,为第七届GAIR全球人工智能与机器人大会,带来最为激荡的思想碰撞。这是国内首个出海的AI顶级论坛,也是中国人工智能影响力的一次溢出。
算力、数据、infra作为大模型时代的超级基建的组成部分,在这次AI顶级论坛上,季昕华与一众业界大牛也将一同出席,围绕《大模型时代的超级基建》主题来进行一次深刻探讨。论坛邀请了重磅嘉宾包括UCloud董事长季昕华,新加坡国立大学校长青年教授尤洋、汇智智能联合创始人刘黄骁烈,Zilliz创始人星爵,云启资本合伙人陈昱。
他们将会共同探讨大模型时代的超级基建的雏形,如何在大模型时代做好超级基建这一底座等话题。
如果你对此深感兴趣,可以免费抽取原价3000元/张的大会两日通票,点击文末【阅读原文】即可注册。
左右滑动查看更多
//
近期热门文章
关键词: