一
16 日,百度正式发布文心大模型4.5及文心大模型X1,在文心一言官网即可免费使用。
文心4.5在多项基准测试成绩优于GPT4.5、DeepSeek-V3等。均分达到79.6分,略高于GPT4.5的79.14。而文心X1则对标DeepSeek-R1,也支持多模态,号称是首个自主运用工具的深度思考模型。
这里有两个名词。
所谓多模态,就是支持多种形式数据(文本、图片、视音频)的输入和输出,可以做到全局上下文关联而不是前后割裂,在一些复杂场景中,比如自动驾驶,比如 ai 医疗,都得多模态。业内一般认为,在 2030 年多模态将到达规模化应用阶段。
所谓自主运用工具,就是 ai 会自主调用自动匹配最佳工具组合。比如说,用户在做行业趋势研究时,ai 会调用商业信息查询的 api 接口获取数据,还会用树状图生成工具,来输出可视化图表的结果。
得到的 CTO 快刀青衣,在他的《快刀广播站》(BTW,我非常愿意推荐这门课给各位,反正对我帮助极大)中曾提到 OpenAI 对 ai 的阶段性划分——必须提及,这篇文章的发布时间是 24 年 7 月。OpenAI 自认为自己在什么阶段是半年前的事:
在我的理解中,这个“自主运用工具”可能是实现智能体的重要一环。
二
新发布的文心大模型,技术上到底真牛逼还是吹牛逼,我一个文科生,确实也不了然。
资本市场表现亮眼。17 日,百度美股价格大幅飙升9.01%,可谓气势如虹。
3 月 17 日,美股总体表现是略微上扬,科技股则分化比较严重,但中概股十分亮眼,纳斯达克中国金龙指数暴涨4.03%,创22年2月以来新高。百度和奇富科技(即360 数科)以均超越 9% 的涨幅,算是中概暴涨的领头羊。
但在形势一片大好而不是小好的情况下,百度也迎来简中互联网上的一次重大舆情。从舆情波及面来看,这次的谢广军副总裁事件,可能比去年 5 月璩静副总裁事件,还要大。
北京时间下午 5 点(纳斯达克其实还没开盘,飙升还没发生),谢广军在朋友圈致歉:
#百度副总裁谢广军道歉#,在微博热搜上一度登顶,我所看到的访问量顶峰数据是:3.3亿。
三
关于谢总的孩子,究竟是从哪里获得他人隐私信息的——也就是网上俗称的开盒挂人,还是有些争议,不少人指责谢广军泄露了用户数据给他的小孩。毕竟,谢广军本人是负责百度智能云业务及大模型技术研发与产业应用的副总裁,看上去是涉及用户数据和网络安全的。
根据财新的报道,百度负责安全平台业务的副总裁陈洋,于 18 日在百度内部发文称,经调查,“从结果上看,确实不是谢广军干的,也不是从百度泄露的”。“从我们的调查结果看,也是确认谢广军完全没有相关数据库的任何权限,从操作行为日志看,也没有做这样的事情的尝试”,云云。
3 月 19 日晚七点半,百度官方也做了类似的声明。
我基本采信这个说法,虽然看上去 13 岁的小姑娘就会跑电报上,获取海外所谓社工库数据(全称“社会工程学数据库”,本质是非法收集的个人隐私数据集合),有点匪夷所思。但考虑到其饭圈中略显狂热的身份,我也不是太惊讶。
饭圈内部,是有一定的分工的,类似技术组、数据组这种细分“部门”,也是见诸于不少媒体报道的,所以有人教不稀奇。再做进一步的没有什么实际证据的想象,一个家境优渥的小姑娘,在其圈中,很有可能也是一名小小的 KOL,自己不会喊一声,有人帮忙也不稀奇。
饭圈因为互撕而开盒,真不是什么新鲜事,我见过很多媒体报道,只是不能形成所谓的热点。今次之所以冲上热搜,我看和百度副总裁这个身份极有关联——这个传播热点的核心,应该是一个坑爹的故事。
在传播中,一些细节也成了一些热议点。比如我在小红书上看到,关于百度副总裁月薪 22 万(小姑娘晒的截屏中明确是税后)到底算不算高。
从绝对数字来看,当然算高的。但考虑到当初璩静事件,坊间盛传她年薪 700 万甚至以上,似乎又不是很高。毕竟月薪 22 万,就算加上年底 n 薪和股票奖励,年包距离 700 万似乎还是有些距离。我现在偏向于认为,传璩静年薪 700 万,可能夸张了。
毕竟一个文科副总裁,一个理科副总裁,而百度又是所谓“工程师文化”,对吧
四
有媒体报道称,谢广军领导的百度智能云事业群组是百度核心增长引擎之一。
中国人在教育议题上,是相信“言传身教”四个字的。谢广军先生的业务能力出色,但似乎对自家小孩这个言传身教确实不够。所谓“未能及时教会她尊重、保护他人及自己隐私”,作为成天和数据打交道的企业高级管理人员,确实也应该深感愧疚。
但我个人总隐隐觉得,或者这么说,请百度高层反思一下,是不是足够在意用户隐私、用户数据之类的东西。请注意,我不是说他们不 care,而是说他们不够念兹在兹,以至于没有达到“言传身教”。
因为今天这起新闻,让我又想起当年李彦宏的一句所谓大实话。
五
2018 年3月26日,在北京举行的中国发展高层论坛上,百度CEO李彦宏在一场公开对话中谈到了对用户隐私问题的看法。为避免有断章取义之嫌,我这里作稍多一点的引用,尽可能顾及上下文:
当你把不同领域的数据汇集到一起,力量就会变得更强大。但是我们也非常了解隐私问题,或者说数据保护,我认为在过去几年里,中国已经越来越意识到这个问题的重要性,而且执法力度也加强了许多。但同时我也认为,中国人对隐私问题的态度更加开放,相对来说也没那么敏感。如果他们可以用隐私换取便利、安全或者效率,在很多情况下他们就愿意这么做。当然我们也要遵循一些原则,如果这个数据能让用户受益,他们又愿意给我们用,我们才会去使用它。我想这就是我们能做什么和不能做什么的基本标准。
我甚至愿意把这段话发表时当时的视频嵌入到下方,你可以看到,李彦宏做的这个回答所针对的问题是什么,他当时陈述的时候语调是什么,表情是什么——我不仅在展示文本,也已经尽可能地展示语境了
这段话,后来被浓缩成诸如“中国人可以用隐私换取便利”之类的标题。
而我比较在意他的表述中的所谓“更加”。这是一个比较级,意味着用隐私换取便利、安全或者效率,相对于外国人,中国人是“更加愿意”的。
李彦宏说的是不是实话?这个细究起来,因为更加嘛,所以你得把除中国以外的所有老外都研究一遍。但如果不细究,就说一个感觉,似乎也成立。
但实情归实情,你堂而皇之在公开场合表述,则又是另外一回事。
就我个人观感来看,李彦宏似乎并不是太在意这件事。在他的认知里,中国人的数据隐私敏感度“更“低嘛,而且这个点,拿出来说说,也没啥了不得的。
反正你们愿意给,我们就可以用。至于这个愿意不愿意给,其实真的,互联网公司的所谓用户同意协议之霸王,我们见得还少么?
所以,这是一个意识问题,我个人并不觉得百度的核心高层,这方面的意识有多强烈。
六
说到互联网公司的霸王条款,本月头上,腾讯元宝还招来一些批评。后者于3月5日公开道歉,并对引发争议的条款进行了紧急修订。
腾讯元宝最近的推广攻势相当猛烈,甚至下沉到了乡间。我见过一个短视频在宣传元宝下乡。
在这个截屏中,一个趣点在于刷墙小哥怕是犯了点小错误,农田病虫害识别,问腾讯元宝,如此刷法,别问腾讯元宝就显得太突兀了。
第二个趣点是:咦,batbat,这个 b 真就给你换掉了啊,百度不配上桌了么?
七
最后说一下新版本文心一言,我个人的一次使用体验。
文心的反应,似乎它不知道这个事。我第一个念头,是不是在躲闪啊?于是我追问之。
确实没躲闪。但我要指出两个槽点
第一个槽点:作为用户,我什么时候说过谢广军事件是学术造假了?文心这个幻觉实在是不轻。
第二个槽点,文心对我问题的理解能力未免太差了。我明明告诉你谢广军是因为自己小孩开盒而致歉,咋文心就认为是谢广军是因为小孩遭网暴而去开盒他人然后致歉呢?
我确认了一个事,至少在我做这一番操作时(3.18 日晚),文心没有刻意去躲闪或保护谢广军,但,能力嘛。。。见仁见智咯。
—— 首发 扯氮集 ——
0
推荐