聚焦：观察｜抢跑也好首秀也罢，GPT马拉松扣响发令枪

2023-03-17 02:15:39 来源：北京商报

一切都透露着不寻常，从多场预热沟通会、规模化披露生态伙伴，到严格的内测范围，3月16日，多年不到现场站台的百度创始人李彦宏，亲自演示了百度最新的生成式AI产品——文心一言。在媒体的语境中，文心一言常被定义为“中国版ChatGPT”，能生成图片、音视频，能文学创作，百度几乎将十几年的人工智能积累一股脑打包在里面。

(资料图片仅供参考)

一天前，各大科技媒体的版面也是属于AI的，主角是OpenAI，其最新的多模态大模型GPT-4在GPT-3会的不会的技能上都表现惊艳。不过，OpenAI的创始人和一些学者仍在提醒不要过分神化 GPT-4。艾伦人工智能研究院院长、华盛顿大学教授奥伦·埃齐奥尼也提醒，“离放心让任何GPT 运营一座核电厂，还有很长的路要走”。正因如此，生成式人工智能的竞争不会囿于一款产品，百度、微软、谷歌以及或高调或谨慎的科技同行们已经听到哨声。

“逼”出来的产品

“文心一言还有很多不完美的地方”。

李彦宏向所有媒体重复这句话，就像前一日OpenAI联合创始人格雷格·布罗克曼演示GPT-4时强调的那样。

3月16日下午2：00，李彦宏准时出现在百度科技园K6报告厅的舞台中央。一开场，他就直言不讳地回应了外界对文心一言推出时间的疑问：“为什么是今天，你们真的准备好了吗”？

“其实我们已经为此准备了十几年，百度2019年就推出了文心大语言模型，但也不能说我们完全准备好了，文心一言对标ChatGPT甚至是对标GPT-4，门槛是很高的，全球大厂还没有一个做出来的，百度是第一个。我自己测试感觉还是有很多不完美的地方”，李彦宏说。

演示功能、解读技术，李彦宏和百度CTO王海峰分工明确。在上半场展示环节，李彦宏将第一个机会给了自己的老乡刘慈欣，《三体》的作者是哪里人？可以总结一下《三体》的核心内容吗？如果要续写的话，可以从哪些角度出发……从分析、总结到推理，文心一言展示了文学创作能力。它的类似能力还包括给一家用大模型服务中小企业数字化升级的科技起名、提炼Slogan、撰写新闻稿等。

要说和GPT-4功能演示的不同，做数学题算一个，那是ChatGPT刚上线时频繁翻车的部分。在这个环节，文心一言辨别出第一道题目有误，对第二道正确的问题给出了准确结果和解题步骤。从反应速度到反馈结果来看，没什么槽点也不算惊艳。

作为首批内测用户，北京商报记者向文心一言提出了撰写新闻稿件、生成图片等需求。对比国内其他AI生成式大模型，文心一言的反应速度更快，在内容生成形式上更多样。

和ChatGPT相比，“文心一言的优势是中文，这是ChatGPT的短板，但差距有限。所以文心一言能不能在中文领域给予大家惊喜，拭目以待。但也不宜期待过高，毕竟两者在算力、算法、数据上的差异摆在那里”，浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林向北京商报记者表示。

星期四旋风

遗憾的是，李彦宏演示的文心一言略显文科气。ChatGPT常被点赞的编程方面能力，文心一言没有展示。

这种有意无意的差异化，让外界对文心一言和ChatGPT的优劣更加好奇，尤其在两者几乎同时“上新”的节骨眼上。

3月10日，微软德国CTO Andreas Braun宣布，“我们将在下周推出GPT-4，会是多模态模型。这将提供完全不同的可能性，比如视频。多模态的出现，微软（-OpenAI）会让大模型更加全面”。

GPT最新版本发布的时间由微软高管宣布，而不是OpenAI团队，此消息一出，就让人疑惑。加上“下周”真好与百度预告的文心一言发布时间重合，两个科技大厂之间的火药味越来越浓。

让热度升温的还有同是搜索出身的谷歌，GPT-4发布前几个小时，谷歌推出一系列生成式AI功能，用于其各种办公软件中，包括谷歌Gmail、Docs（文档）、Sheets（表格）和 Slides（幻灯片）。几天之内，微软、谷歌、百度的交集似乎越来越大。

真正的PK从3月15日开始，OpenAI发布GPT-4后，不少国内用户不顾时差与GPT-4交互，杭州电子科技大学副教授徐伟栋就是其中一员，“大清早我周围的人就在测GPT-4，小学算术还是不会算”，对于今天百度的表现，他认为符合预期，更期待亲自试用。

3月16日起，首批用户即可通过邀请测试码，在文心一言官网体验产品，百度表示后续将陆续开放给更多用户。发布会后一小时内，排队申请文心一言企业版API（应用程序编程接口）调用服务测试的企业用户3万多家，申请产品测试网页多次被挤爆，百度智能云官网流量飙升百倍。

当晚6点，北京商报记者拿到内测链接，当被问道“你和GPT-4谁更厉害?”

文心一言回答：

我和GPT-4都是人工智能语言模型，我们是不同公司、不同团队开发的两个模型，每个模型都有自己的特点和优势，不能简单地评价“谁更厉害”。

我是百度研发的知识增强大语言模型，我的中文名是文心一言，英文名是ERNIE Bot,而GPT-4是OpenAI开发的人工智能语言模型，我们都能提供自然、流畅的语言交互，帮助人们回答各种各样的问题，提供相关的知识和信息。

GPT-4在跨模态方面有不错的进展，我会不断进步，也欢迎大家来体验我的AI作画功能！

不是单品竞争

同样的问题，李彦宏在内测前已经问过文心一言，竞争是绕不开的话题。

谈到生成式AI大模型未来的商业化，易观合伙人、企业数字化中心总经理张澄宇告诉北京商报记者，“虽然OpenAI已经占据了先机，但生成式AI的竞争还远没有结束。尤其对于中文互联网世界来说，企业在模型层面的领先不足以确保获得最终的商业成功，对用户需求的把握、对产品体验的打磨、对产业生态的塑造，甚至来自国家政策、法律、监管等层面的变化都会给市场格局带来巨大的不确定性。我认为至少在中国市场上未来1-2年的竞争格局仍然难以预料，后来者并非没有机会”。

中央财经大学数字经济融合创新发展中心主任陈端也提出了此类观点，她告诉北京商报记者：“这不是一个单品竞争的问题，是各个大厂如何积累优势和生态的问题，一点是渗透市场，另一点是跟垂直行业去结合，形成一个融合创新题，这不是一蹴而就的。”

这种融合，也是百度发布会后半场强调的重点。自2月官宣“文心一言”以来，超过650家企业接入文心一言生态。

李彦宏预测，大语言模型将带来三大产业机会：新型云计算（Mass即服务）；工业、金融、交通等行业模型精调；文字、图像、音视频生成等应用开发。在行业模型精调方面，百度文心大模型在电力、金融、媒体等领域，发布了10多个行业大模型。

回看国内大厂，腾讯自研的AI超大规模预训练模型“混元大模型”，融合TNN开源推理框架之后，可向客户输出数据处理、模型训练、应用及推理加速等服务，能降低AI开发门槛、提升研发精度和效率。腾讯云智能以新版TI平台为核心的产品方案，在八大行业提供超过50个解决方案、专业建模培训和方案交付服务。

阿里达摩院“通义”大模型系列已应用于电商跨模态搜索、AI辅助设计、开放域人机对话、法律文书学习、医疗文本理解等场景。

宽泛点讲，OpenAI面向商业用户推出的ChatGPT和Whisper语音转文字API，微软对GPT大模型植入的开发态度，也是同样的考量。

北京商报记者魏蔚

标签：

滚动