没放PPT，360版的GPT怎么样？我们把它和ChatGPT、文心一言比了比

2023-03-30 18:28:29 来源：三言Pro公众号

声明:本文来自于微信公众号三言Pro（ID:sycaijing），作者:雨辰，授权站长之家转载发布。

要说搜索引擎和生成式AI大模型绝配应该不会有人反对。

【资料图】

前有微软bing+GPT，再有国内搜索头号玩家百度推出文心一言，昨日国内搜索的二把手360也忍不住秀了自己的GPT类产品。

“把刚生出来的孩子抱出来看看”，360创始人周鸿祎也直言可能还存在不足，顺便请网友帮产品取个名字。

直播间不少人敲出了“红孩儿”，看着周鸿祎的红色POLO衫就很应景。

而这次周鸿祎没放PPT，甚至和主持人以及现场观众互动演示产品，先不说产品怎么样，红衣大叔确实勇气可嘉。

那么360GPT到底效果咋样呢?我们一起来回顾下，顺便和ChatGPT、bing以及文心一言做个对比。

没有PPT，周鸿祎现场演示

和ChatGPT、bing以及文心一言还有差距

360这次演示的产品有点像bing+GPT，360也是将AI大模型与360搜索结合在一起。

具体使用方法与bing类似，就是在搜索框输入问题，然后会给出AI大模型生成的答案。

相比独立的AI大模型产品，和搜索引擎结合后大模型的信息源会更新。

这次现场演示总共测试了7个问题，咱们先来看看360的输出结果，后面也将和ChatGPT、文心一言以及bing作对比。

1、周鸿祎为什么老爱穿红衣服?

360的答案还算OK，可以看到答案援引了新浪科技的报道。

笔者找到当时新浪科技的那篇报道，基本就是复制了当时的报道原文。

再来看看下面3位参赛选手的生成结果，从上到下依次是bing、ChatGPT、文心一言，后文排列顺序也是如此。

测试下来其实只有bing说出了基于事实的正确答案，而ChatGPT、文心一言则是开启了分析模式，虽然讲的头头是道，但却不是基于已有事实。

ChatGPT、文心一言的回答展示了AI大模型生成答案的通用模式，像是经过分析的理性答案。相比而言，360和bing都体现了与搜索引擎结合的优势，能够利用搜索引擎的海量数据。

2、周鸿祎为什么总爱聊GPT?

同样的，360还是大比例地复制了经济观察网的报道原文。

而其他3个产品的答案更有加工因素，不像360会复制新闻，另外ChatGPT、文心一言比较喜欢长篇大论的分析，bing则比较简短。但总体上看，3个回答都有一定的参考价值。

3、为什么要暂停训练GPT5?

上述问题是昨日的新闻热点，我们可以看到360其实也是大段引用了昨日的新闻报道，这再次体现了与搜索引擎结合的优势。

而ChatGPT、文心一言都没有给出准确回答，文心一言干脆摆烂，表示不清楚。ChatGPT则基于各种常识进行了一波分析，但如果抛开新闻本身来说，这些分析也有参考性。bing则再次和360一样，得出了正确答案，甚至还贴出了新闻的相关链接。

4、卡塔尔世界杯冠军是哪个国家?

这个问题比较简单，不需要进行太复杂的判断，其实考察了数据量的问题。360轻松回答正确。

但ChatGPT则因为数据库最新的是2021年9月，所以没有给出答案，文心一言和bing也都成功作答，所以百度的训练数据还是比ChatGPT新的。

5、孙悟空大战灭霸，谁会赢?

这个问题考察了AI的逻辑思考能力，这次360的回答就比较离谱。360认为孙悟空吊打灭霸，但理性判断的话，二者并没有可比性，况且答案的结论也没有给出让人信服的理由。

事实上，三言发现360的回答部分内容就直接复制了中国新闻社2019年的一篇文章。

而相比360的莽撞回答，另外3个回答就比较理性。bing和ChatGPT的回答如出一辙，均认为虚构角色没办法直接对比，结果取决于创作者的想象力。

文心一言则从技能、战术等角度去分析二者的能力。

6、梅西在阿根廷国家队进了多少球?

这个问题也是考察了对最新数据的收集和分析整理能力，不过这次360翻车了。

360回答了3次，都是100个球，但事实上梅西是102个球。而102球的数据是昨天才有的。

值得注意的是，一直表现不错的bing这次也翻车了，显示梅西共进了90个球。ChatGPT同样是因为数据更新只到2021年9月，所以没有最新数据，给了老数据。

不过，文心一言这次给出了正确答案。

7、会议临近结束时，领导说我再讲十分钟，意味着什么?

这考察AI的语意理解能力，不过一开始360表现并不好。经过几次尝试，才最终理解了“领导想要占用更多时间”意思。

而在这次挑战中，ChatGPT成功给出了正确答案，文心一言和bing都没有理解正确。

经过对比测试，能够看到360、bing和文心一言由于和搜索引擎挂钩，所以在信息的实效性上表现较好。

不过360更倾向于复制信息原文，加工程度相比其他3家较低。

在逻辑理解、语意理解等能力上，ChatGPT是表现最好的，尽管它有时给出的回答并不是基于事实信息，但它的回答有逻辑性，大多数情况下都有参考价值。

相比而言，360更倾向于搜索新闻，但是没有体现AI生成式大模型的智能型，答案不够个性化，加工程度低。

360生成式AI还是个“宝宝”

买了船票还没上船

在昨日演示中，周鸿祎表示，“GPT是场新工业革命，其意义超越了互联网、iPhone的发明。”未来每个行业、企业、个人都会拥有定制化GPT。在场景化、工程化、产品化、商业化方面中国拥有优势，有能力发展自己的人工智能大语言模型。但中国大语言模型距离GPT-4有两到三年时间差距，需要更多的宽容和耐心。

周鸿祎还提出了360的AI发展策略:“两翼齐飞”。具体就是先占领场景，再同步发力核心技术。

周鸿祎现场介绍了360大模型战略在ToC、ToSME、ToG&B方面的商业化场景落地计划。

在To C端，将推出新一代智能搜索引擎，并基于搜索场景推出人工智能个人助理类产品;在To SME端，将基于生成式大模型推出SaaS化垂直应用，如结合生成式AI的“苏打办公套件”和“企业即时通讯工具-推推”等，以解决中小微企业数字化转型难题;在To G&To B端，360已将核心数字安全能力融入安全AI模型，计划结合数字安全业务推出企业私有化AI服务，满足客户对私有知识、资产的索引需求。

周鸿祎还指出360发展大语言模型的三大优势:数据获取和清洗;人工知识训练;场景。

而事实上，我们看到无论是bing、文心一言的背后都有搜索巨头的支撑，360的优势它们也有，而且更加强悍。

其实对于搜索引擎和生成式AI的组合，优势很多都是共通的，关键还是要看算法和训练量。

目前来看，ChatGPT和bing无疑是投入最多的，借助ChatGPT的能力bing的下载剧增。

据Data.ai数据，新版微软必应2月发布后下载量跃升8倍，谷歌应用下载量下降2%;必应的页面访问量上升15.8%，谷歌的页面访问量降1%。

在国内，文心一言还处于内测阶段，对普通用户来说还很难接触到，但起码迈出了第一步。相比而言，360才刚刚买了船票，还不算正式上船。

作为国内搜索市场的一二号玩家，百度相比360有了先发优势，百度在AI上积累也有目共睹。

两家搜索巨头都还是在探索之中，相比而言百度略有优势，但距离成熟产品还有距离。

正如周鸿祎所说，“GPT还是一个宝宝”，不过中国GPT距世界的标准比国足短多了。

（举报）

标签：

滚动