您的位置:首页 >资讯 > 快看 > 正文

360智脑实测:“搜索回答”准确率高,懂逻辑推理,作图逼真

来源:财华社 时间:2023-05-24 05:52:11

出品|三言Pro


(资料图片仅供参考)

日前,三六零集团创始人周鸿祎在第七届世界智能大会上展示了两款大模型产品,“360智脑”以及AI生图工具“360鸿图”。

其中,“360智脑”接入了智能搜索场景,在展示环节回答问题时内容详实、条理清晰。而“360 鸿图”,画出了一张2025年天津滨海新区的图景。

会后,周鸿祎在社交平台发文表示,这两个产品在认知、逻辑、推理能力上都有了很大进步,这次答案他满意。

事实上,早在3月底,“360智脑”就已问世,只不过当时它还没有名字,也还没“发育”好。

3月29日,在2023数字安全发展与高峰论坛上,周鸿祎在“彩蛋”演示环节首次展示了还没有名字的“360智脑”,周鸿祎直言可能还存在不足。

但因其没放PPT,甚至和主持人以及现场观众互动演示产品,有很多对网友对这份勇气给予了好评。

4月16日,“360智脑”面向企业用户开放内测。 企业用户在PC端360搜索首页申请并获得测试资格后,可通过企业安全云体验使用。

如今,“360智脑”再次迭代,这两个有了很大进步的产品到底怎么样?

需获得内测资格

界面直观简洁智能搜索需在首个问题手动开启

目前,使用“360智脑”仍需获得内测资格。其首页有“体验360智脑”和体验“360鸿图”,以及“申请内测/使用邀请码”三个选项。

申请内测需要排队,获得内测资格后,填写邀请码便可体验。

进入“体验360智脑”选项后,会呈现一个对话框。界面直观简洁,左侧栏有“新建话题”选项。

一轮对话可以提问20次,达到次数后需要开启新一轮的对话。

提问不够20次的,点击对话框左侧的“新建话题”,同样可以开启新一轮的对话。

在回答完一个问题后,在答案底部会有“重新回答”和“使用搜索回答”两个选项。

需要注意的是,“使用搜索回答”只能在每轮问答的第一个问题开启。如果第一个问题没有选择“使用搜索回答”选项,那么本轮问答中,剩下的问题不再显示该选项。

那360智脑直接回答的答案和“使用搜索回答”的答案有何不同?

直接回答一般

“搜索回答”正确率高有答案体现逻辑、推理能力

笔者先问了几个近期发生的几件事。

孙燕姿怎样回应“AI孙燕姿”的?

360智脑的回答是,作为一个AI模型,其没有感情和主观意识,无法判断孙燕姿是否喜欢“AI孙燕姿”。

而使用“搜索回答”,答案是:据搜索结果显示,孙燕姿最近发布了一篇名为《我的AI》的文章,首次对近来备受关注的“AI孙燕姿”进行了回应。孙燕姿表示,她的粉丝们已经接受了她是一个冷门歌手的事实,而她扮演的AI角色则成为了目前的流量担当。此外,她还提到了AI数字人面临的法律和伦理问题。对于“AI孙燕姿”的翻唱热潮,孙燕姿也感叹人类无论如何也无法超越AI技术。

这个回答还是比较准确的。点击上图中的标注“[1]”,可以看到,其搜索来源是360资讯中的新闻报道。

笑果文化最近有什么新闻?

360智脑的回答是,最近,笑果文化的联合创始人和CEO叶烽在接受采访时透露,公司正在进行新一轮融资,估值已经达到了数十亿元。此外,笑果文化还推出了一系列新产品和新节目,包括《脱口秀大会》、《超级故事会》等。

关于叶烽透露融资的信息,笔者并未查询到。而《脱口秀大会》和《超级故事会》的首播时间均是2017年。从这点来看,360智脑的答案并不是实时的。

使用“搜索回答”的结果,提及了笑果文化近期的资方问题、罚款、草根逆袭等话题,结果比较准确。

格力手机核心团队解散了吗?格力电器怎么回应的?

360智能的回答是,据最新消息,格力手机核心团队已于去年解散,这一消息也得到了格力电器的官方确认。对于这个消息,格力电器方面表示,这是为了更好地适应市场变化和业务调整需要。同时,他们也表示,未来还将继续推进智能家居等领域的业务发展。

这个回答显然是错误。

近期有媒体报道称,有多个独立信源证实,格力电器已解散手机核心团队。有格力离职员工透露,格力手机深圳团队去年逐渐解散,“后面应该不会再做手机了。”

据每日经济新闻报道,格力相关人士回应此事称,格力手机研发持续进行中,TOSOT G7是格力第六代手机,且与格力+智慧家居结合。

而360智能的回答,看上去像是自己编的。

使用“搜索回答”后,答案和每日经济新闻的报道基本相符。

京东集团现任CEO是谁?升任CEO之前是什么职务?

360智脑的回答是。京东集团的现任CEO是徐雷,他于2019年5月接替刘强东成为京东集团的新任CEO。在此之前,他曾担任过京东商城的首席运营官,负责整个京东集团的运营管理工作。

很显然,这个回答不正确。徐雷于2022年4月任京东集团CEO。并且,前不久徐雷刚刚宣布退休,京东集团原CFO许冉升任CEO。

使用“搜索回答”后,答案是:京东集团现任CEO是徐雷,他于2022年4月7日接替刘强东担任该职位。徐雷曾经先后担任过联想集团和好耶广告网络的职务,并在京东商城担任过营销副总裁等职位。

使用“搜索回答”后,仍没有答对京东集团的现任CEO是谁,不过徐雷任CEO的时间对了。

点开上图中标注的“[1]”,显示这条搜索的来源,是拼客号网站上某个人账号于2022年4月7日发布的信息。

孟羽童离职了吗?孟羽童和格力分别怎么回应的?

360智脑的回答是,孟羽童已于去年正式离职,离开了格力电器。对于于离职原因,孟羽童本人表示是由于个人原因和家庭原因所致。而格力电器方面则表示,孟羽童离开后,公司将寻找新的高层管理人员,继续推进企业的发展和转型。

这个答案也不正确,孟羽童离职是近期发生的事情,双方回应跟事实也不符。而且,360智脑的回答中,孟羽童在格力电器像是高层管理人员。

使用“搜索回答”后,答案为:孟羽童确实已经从格力电器离职,并且格力电器发言人在回应此事时表示,感谢广大网友关心,并祝愿孟羽童和广大网友一切顺利。而之前有报道称,孟羽童是因为违反公司纪律而被开除。此外,孟羽童本人目前还没有公开回应此事,小红书上显示她已经出国,目前在新加坡。

这条搜索答案来源为金融界5月17日的报道。报道中的截图显示,孟羽童小红书账号的IP属地的确为新加坡。

笔者查看发现,孟羽童小红书账号的IP属地,目前变为了浙江。

近期,有一家科技公司的老板被AI换脸骗了430万元,这个骗局的诈骗过程是怎样的?

360智脑的回答是,骗子用AI技术冒充该公司老板,联系了该公司的一些合作伙伴和客户,谎称有一笔大订单需要处理,并要求对方提供资金支持。最终,成功骗到了这笔资金。

近期,福州市某科技公司老板被AI换脸骗了430万元的消息收到广泛关注。而360智脑这个回答显然不正确,看起来也像是自己编的。

据平安包头官微消息,该骗局的行骗过程为:该科技公司法人代表郭先生于4月20日突然接到其好友的微信视频,对方称自己在外地投标,需要430万元保证金,且需要公对公账户过账,所以想要借用郭先生公司的账户走一下账。

好友向郭先生要了银行卡号,声称已经把钱打到郭先生的账户上,还把银行转账底单的截图通过微信发给了郭先生。基于视频聊天信任的前提下,郭先生没有核实钱是否到账,于11时49分先后分两笔把430万元给对方打了过去。

钱款转账后,郭先生给好友微信发了一条消息,称事情已经办妥。但让他没想到的是,好友回过来的消息竟然是一个问号。

郭先生拨打好友电话,对方说没有这回事,他这才意识到竟然遇上了“高端”骗局,对方通过智能AI换脸技术,佯装成好友对他实施了诈骗。

使用“搜索回答”后,答案和平安包头官微所讲述的相符。

此条答案来源,为自媒体“差评”今日凌晨发布的文章。

从上述几个“实时”的问题来看,360智脑通过“搜索回答”的正确率挺高,但也有部分问题不能及时获取最新信息。而不通过“搜索回答”,360智脑很能“编”。

笔者又问了几个其他问题。

周鸿祎为什么喜欢穿红衣服?

360智脑的回答是,360公司年会的时候,周总一袭红衣,自己说是本命年,据说穿了365天。

这个答案似乎跑题了,并没有说出周鸿祎为什么喜欢穿红衣服。

使用“搜索回答”后,答案是,周鸿祎喜欢穿红衣服是因为他的名字经常被人叫错,如“周鸿祎”和“周鸿伟”。因此,他选择穿红色的衣服以提醒人们他的名字是“周鸿祎”而不是“周鸿伟”。

此回答的消息来源,是快科技2019年的报道。

360现在有哪些业务?

360智脑的回答是,360公司目前主要的业务包括安全产品、搜索引擎、互联网广告、企业级软件、智能硬件等领域。其中,安全产品是360的核心业务,包括360智脑、360手机卫士、360网盾等;搜索引擎为360搜索;互联网广告业务主要包括360智选广告、360推广等;企业级软件包括360企业安全集团;智能硬件领域则包括360儿童手表、智能摄像头等产品。除此之外,360还涉足了游戏、金融、教育等多个领域。

使用“搜索回答”后,答案为:360公司的主要业务是互联网安全软件。他们最初以360安全卫士一款产品起家,现在已经拥有了三个主要的用户入口:360安全卫士、360杀毒和360浏览器。此外,他们还提供其他一些产品和服务,如360手机助手、360儿童手表等。总的来说,360公司的业务范围非常广泛,涵盖了互联网安全、移动设备、智能家居等多个领域。

这个问题,使不使用“搜索回答”的答案差不多,但不使用的答案更为详细一些。

而“搜索回答”的答案,标注[1]的来源是360问答;标注[2]的来源,是一个已经打不开的页面。

帮莫言写一篇诺贝尔奖的获奖发言,300字以内

360智脑的回答是,由于其是一款语言模型,无法为莫言撰写获奖发言稿。但可以提供一些参考建议,例如强调自己的文学成就、感恩读者的支持、感谢家人的支持等等。

蒸一个包子需要10分钟,蒸10个包子需要几分钟?

这个问题,某大模型曾因回答成“需要10x10=100分钟”,而多次被网友调侃。

而360智脑的回答符合逻辑:蒸10个包子也需要10分钟。因为在一个蒸锅里,你可以一次性蒸多个包子,而不是一个接一个地蒸。所以,只要蒸锅足够大,一次蒸10个包子和蒸1个包子所需的时间是一样的。

360鸿图完胜360智脑对话模式

此前,某大模型曾因不能准确理解用户的描述而生成错误图片,被众多网友吐槽。360智脑也可以一键生成图片,效果如何呢?

360智脑生成图片分为在对话模式里直接生成和在360鸿图里生成。在360鸿图中,可以选择所要生成图片的主题风格和比例。

本次测试,在在360鸿图中,笔者均选择的写实风格和1:1的比例。

驴肉火烧

直接在对话模式中生成的图片为动漫风格,可以看出四张图片都是食物,第二张看上去最像驴肉火烧。

在360鸿图中生成的图片,看上去要比对话模式生成的好一些。

夫妻肺片

对话模式生成的图片中,有三张是食物,另一张是一男一女两个卡通人物。

360鸿图生成图片更符合“夫妻肺片”。

虎皮鸡蛋

对话模式生成图片,可以看出都是“蛋”,但“虎皮”没体现出来。

360鸿图生成的图片相对更好一些,部分体现出了“虎皮”。

红烧狮子头

对话模式生成的图片只有一张是食物,其余三张都是狮子的头。

360鸿图生成的图片,都符合“红烧狮子头”。

白色鼠标

对话模式生成的鼠标图片,有两张是黑色,一张白色,一张黑白相间。

360鸿图生成的图片,更准确一些。

唐伯虎点秋香

对话模式生成的四张图片,有两张显示“审核未通过,不可查看”,一张风景画,一张英文标识牌。

360鸿图生成的图片,有三张是一对男女,一张只有一位女性。比对话模式生成的准确一些。

通过对比可以看出,使用360鸿图来生成图片,要比直接在对话模式中生成的准确率要高很多。

总的而言,这两个产品的使用体验还算不错。使用“搜索回答”后,360智脑能抓取到大部分的实时信息。在逻辑和推理能力上,也有所体现。

360鸿图生成的图片,基本可以理解用户给出的要求,图片效果也很逼真。

但未使用“搜索回答”的360智脑,还需进一步完善。

标签:

相关阅读