大厂需要证明,他们投入的数十亿元甚至数百亿资金并没有打水漂。
与张一鸣熬夜读论文、王兴收购初创公司不同,刘强东带领京东高管捕捉大模型的方式是在真实场景中不断尝试产品和服务。
刘强东在2017年就说过,AI既是一种技术,也是一种思考方式,他甚至畅想过,京东未来将实现无人办公场景。
技术大变革期,也是公司兴衰交替的关键期。他不可能无视大模型这种颠覆性技术所产生的影响,京东将如何参与这场游戏呢?
面对这场底层冲击,各家均有不同的应对方式,对于京东来说,它的实体业务基因更浓厚,自1998年创立,已从中关村的一张柜台发展到如今旗下5家上市公司,还有3家正在寻求上市——京东工业、京东产发和京东科技,员工人数扩张至超56万,业务场景比阿里巴巴、腾讯与字节跳动都要复杂和多元,覆盖物流、零售、金融、健康、工业等等。
产业场景多元以及天然的to B场景,让京东对大模型服务产业的渴求更强烈,天然成为了大模型落地产业最好的“练兵场”。
在京东之前,腾讯、百度以及阿里巴巴都发布了行业大模型方案,但一位SaaS行业人士感慨,只听到雷声,不见下雨,暗示这些互联网巨头不会轻而易举攻下行业山头。
京东的雷声和雨点在哪里?
全集团共建
大模型正在变成京东公共环境的一部分。它以视频与海报的形式,出现在总部电梯间电视里、办公走廊的墙上。
2023年2月份,京东对外宣布将发布服务产业的大模型。很快,大模型在京东集团内部也被提升到了更高的优先级,并很快成立了大模型项目组。
何晓冬博士是京东探索研究院院长及京东科技智能服务与产品部总裁,也是京东自研“言犀大模型”的核心科学家。他说,以零售为例,人们购物的行为是事件驱动,以“我要买什么”开始,但大模型技术加入后,可能以“我要干什么”开始,这意味着,购物行为包括了小红书的种草、抖音的内容以及京东的货架,混合了多种形态。
内容以及交互的变革不断驱动新产品以及巨头公司的兴起。从雅虎的衰落到谷歌的崛起,从淘宝再到抖音的崛起,王座权力的转移总是伴随着这条铁律。如今,大模型为代表的AI则重写这条铁律。
大模型训练需要大量的产业数据做预训练,这些数据分布在京东零售、健康、物流、金融等各个产业线。于是,集团协调,各个BG(事业群)和BU(事业部)都参与大模型项目,最后,大模型项目组的人数达到了100人左右。
“他们把零售、物流、健康等业务数据带进来,也会把大模型的功能带回去用。”何晓冬说。
这构成了京东言犀大模型30%的训练数据来源——京东围绕着数智供应链积累下的高质量原生数据,而剩下70%来源于通用数据。何晓冬形容这个过程就像对大模型进行高等教育——学习了通用知识后开始在大学学习专业知识。
行业数据进来了,对数据还要做脱敏、分类以及加权处理,比如经营、营销、特有知识的数据;针对不同行业,不同数据的加权系数是不一样的,比如金融领域,业务数据权重会多一些,要帮助员工更好地把控风险;零售领域,又分仓储、商城、社区团购、到家、超市等业务单元,不同类型数据对细分的业务场景的重要性也是不同的。
何晓冬强调,要做行业大模型,企业必须在这个行业做到足够的头部以及沉浸数年以上,才能吃透这个行业,了解行业发展的痛点。
在基础设施上,京东云此前就建立了一个1000多张(A100)显卡的机房,这是他们在2021年购入的,集成了英伟达最先进的计算和连接设备,保障大模型的训练和迭代。
京东也在同步采用大模型改造内部流程,他们发起了名为“效能提升”的项目,让程序员运用大模型产品工具,提升敲代码、写注释以及测试案例的效率。综合评估下来,业绩平均估计提升20%以上。
在产品层面,除了智能客服,京东开始内部测试言犀大模型在诸多业务场景中的应用。比如产品搜索与推荐上,电商将很快从“万事皆搜索”进入到“万事皆服务” 的时代。
以搜索“帐篷”为例,未来,搜索结果里不仅仅看到帐篷这个产品,更能看到露营上下游配套的产品和服务,比如上游的旅行地推荐,下游的配套“烧烤”“鞋帽”等产品,加入了类似小红书或者携程的功能。它还可以自动生成一些文案,用户露营完之后,可以发送至朋友圈。
还有金融营销,通过自动化营销助手“AI增长营销平台”提升营销活动方案生产效率。这种全新的交互模式,让人机交互次数从2000次降低至少于50次,操作效率可提升超过40倍。
何晓冬认为,通过人机多轮沟通,机器能更好地理解用户的意图,将意图转化为需求。传统互联网领域里有“注意力经济学”理论,它主要靠设计、折扣、广告等客观条件来吸引用户,但在“意图理解”的场景下,通过多轮对话,用户自己就会沉浸其中,并产生消费以及内容。
这是一个比当下垂类APP更庞大复杂的形态。如果搜索时代是信息聚合与匹配,那么大模型的时代则进入了内容精准生成,用户随时随地 “Ask Me Anything(随便问)”。
打磨毛刺
7月,京东推出言犀大模型之后,并没有急于推向市场,寻求落地,他们的时间路线图是今年下半年内部锤炼,并针对重点场景和客户进行打磨,2024年初对外开放大模型能力。
何晓冬将言犀大模型锤炼的过程称之为“打磨毛刺”。他以健康问诊为例解释,京东计划在8月正式上线健康行业大模型。现在内部更多是Beta(测试)版本,比如会遇到如何保护病人自尊心的问题,这涉及到沟通的语速、方式,小概率情况下,会测出产品说话不合适的现象。
“技术和产品之间其实是有鸿沟的,产品一定是用户角度,技术是创新角度。”何晓冬说。技术体系的人一定要往前走一步,主动贴近产品体系的人。
他预测,现在已经到了大模型技术要通过产品来证明自己价值的阶段。AI技术有点像云业务一样,它是提高生产力的,最后必然为各种各样的行业服务,因此一定是往行业走。
大模型与行业结合越深,其产生的价值也就越大。目前ChatGPT也在摸索对外的商业化,包括通过API(应用程序编程接口)订阅服务等,就如谷歌在互联网时代基于流量的广告模式。
API价值偏低,它的技术理解门槛也比较高,需要企业专人负责调用。而对于大模型开发企业来说,很容易陷入API价格战,变成一门负向的业务。
由此而论,大模型时代,API接口未必是主流的商业化路径,原因在于,它与行业连接太浅,对产业的技术要求也太高,卖产品和私有化部署大模型或许才是正路。据悉,已有人开始叫卖大模型,1000万元就能买到一个完整数据、算法、算力的大模型。
在上海,也有一些“云买手”尝试用大模型为客户服务。以往,他们通过人工服务数十个客户,人均年盈利在二三十万元之间,这就到了天花板。但用上大模型之后,他们人均服务的客户量翻了10倍,释放了大量的生产力以及利润空间。
与业内资深人士的看法类似,何晓冬也认为生成式人工智能是一个完全不同于移动互联网时代的物种。相较于移动互联网时期,京东的探索要更前置,更贴合业务,更不能回避竞争。
事实上,此次大模型之争,大公司竞争的中心点不在资本、地推或者补贴策略,而是各自的研究院或者实验室以及落地场景。
不管是京东还是阿里巴巴、腾讯,他们都有自己的研究院或者人工智能实验室,比如2017年成立的阿里达摩院,2012年成立的腾讯优图实验室,2014年成立的百度研究院,2017年成立的京东人工智能研究院和2020年成立的京东探索研究院。
当前技术大咖们走到了价值创造阶段,他们需要验证,大公司投入的数十亿元甚至数百亿资金不是泡影。
腾讯成立了专门的技术委员会协调各大实验室。腾讯对于研发的态度是,不会取消所有冒险研究,始终会保留一支小分队探索前沿,留下火种。
何晓冬说,他给了京东探索研究院三个任务,第一,要在重要的竞争激烈的领域做到前沿,不回避竞争,愿意挑战和竞争;第二,对重要业务和产品要形成支撑,对公司有价值;第三,要有足够的前瞻性。
创始人与一号项目
从2月高举大旗到6月病退,王慧文的轨迹似乎预示着此次大模型创业热暂告一段落,他创立的光年之外最终被美团收购。坐到牌桌上的,只剩下大公司。
巨头公司争斗往往表面悄无声息,但碰撞在一起的刹那,所产生的能量也是惊人的,甚至会掀翻某个旁观者, BAT时代曾发生的边界大战,就如同今日的一个序章。
外部环境急剧变化,既有宏观层面的挑战,也有AI浪潮的兴起,这些正在让大公司的CEO或者创始人重回一线。
张勇将于今年9月卸任阿里巴巴集团董事会主席兼CEO职务,专职担任阿里云智能集团董事长兼CEO,他希望在那里再造一个阿里巴巴。李彦宏、周鸿祎等纷纷出场,为自家大模型产品代言和推介。
京东集团新任CEO许冉说:“当产业效率和产业的边界拓展得到质的提升后,大模型才有更重要的实际价值和意义,将不亚于又一次工业革命。”在此前召开的2023京东全球科技探索者大会上,她提出了京东对于大模型价值的公式,大模型的价值=算法×算力×数据×产业厚度的平方。
创始人与CEO的关注,既能让项目在公司内部获得大量资源支持,但也会带来压力,那就是尽快产生营收、利润回报。
何晓冬坦言,京东言犀大模型的当下还是一个成本中心,但集团对大模型项目还没有盈利要求;具体到自己负责的智能服务板块,则已经实现了盈利,这也是大模型产业化应用价值的缩影。
如果说,AI是一条河,那么各家公司的产品方案有的是架桥,有的是铺路,有的是造船,各有不同。谁最终越过科学研究到实际产品转化鸿沟的这片“达尔文之海”,只能留给时间来验证。