|
EDA365欢迎您!
您需要 登录 才可以下载或查看,没有帐号?注册
x
福无双至,祸不单行,Google 又又又“翻车”了。$ i- L$ r) l3 y
( u0 ?0 {) S0 D. i% s
% S+ p9 m: Q7 s, ~; X0 {6 L/ A4 W
2023 年 2 月,追赶 ChatGPT 的 Bard,公开犯了事实错误;2023 年 12 月,Gemini 侃侃而谈如同贾维斯,然而视频经过后期处理;2024 年 2 月,Gemini 生成多种肤色的历史人物,被批评歧视白人。4 N( i4 X9 M9 S8 h9 v5 p
7 \, \( P4 w I4 D7 M& }' t" }6 N. A5 E- I) {; h8 u
这回,厄运降临到 Google 的看家本领——搜索。海外网友看热闹不嫌事大,甚至上演了一波斗图狂欢。& X7 M( T- h k# e3 ?) b) w
+ j: N L) q& F) v7 k6 d8 u# z2 Z( b$ f/ V: b4 @3 W- w. ]
被群嘲的 Google AI 搜索,有种清澈的愚蠢
' N" t! a, v) o; `
0 A0 B. z/ y; U: _8 M( v1 [3 q6 R \# |" m
过去不久的 Google I/O 大会,推出的其中一项功能是 AI Overview(AI 概述)。6 c5 Q2 m+ z- r) q, R" B
5 n \" ]5 ]: Y: `5 y
+ k$ u7 X2 B+ U8 O# B9 E4 P4 j
顾名思义,AI Overview 在网页顶部生成综合多个信源的摘要,同时附有链接。
2 J" }0 |* F7 j6 E8 r! N. x) ^ `; k
0 V3 {. ~7 L$ g8 F2 c
& G. ?& t- j( E' D6 I4 k3 F; `, R6 F% a! b# z
( w- U$ P+ ]+ s# j当时,Google 对 AI Overview 很有信心,宣布当即向所有美国用户推出,很快也会推广到更多国家,预计年底覆盖超过 10 亿人。
& ]2 |- \& \+ W7 n2 H, I
; y& u4 F6 G$ S1 H4 Z% k( G' Y9 a j% @5 s$ R# I
然而没过几天,AI Overview 先在美国用户这里翻车了。) b, t+ o! T# G; J
$ `% }! N( Z7 X; c2 I. b
0 P. ^9 k: [. [# R/ _
自制披萨的奶酪容易掉下来怎么办?
2 n* Z2 Z' B: m& l1 u1 @2 r2 Y, L
4 p: }; [5 V6 f' m7 X
7 _! X6 q) H4 x' n' S$ E* q# N) TGoogle 建议您,亲,往酱汁里添加约 1/8 杯的胶水即可。特意强调是无毒的,背后原因令人暖心。
7 c! F" m ~8 w$ O5 p/ C; ~6 l( x8 M
0 ^# ~9 N! H4 U) n- D+ l5 }) L2 ?& G, N
( z& }. l# k2 t, |4 D) y, m d7 @5 N2 Z: P$ ~( ^ }3 u
Google 并非现编,而是从“美版贴吧”Reddit 一位用户 11 年前的评论照搬了答案,可惜它读不懂人类的幽默。
- J% \' k# _- q8 o. C9 y3 _
( t% ~( w( i: M" O% P( O* |) ?# C. X0 s' j
6 e6 d' C9 u* p6 |; B
+ \% ?& w& t9 Y* K* w G5 i) G
人一天里应该吃多少石头补充营养?9 A+ S" E2 B% |2 |
1 R8 J: I2 |' r' k
6 I4 q; l* e( ?5 e; W* L3 W% w. ]Google 没有反驳问题本身的不合理,一本正经地胡说八道,根据加州大学伯克利分校地质学家的说法,应该一天至少吃一块小石头,以便摄入维生素和矿物质。; e7 f: y2 Y; A" E& R+ c C
4 u1 V8 }+ X$ B6 d f3 w+ B, K% c( O# a
/ I+ K; I: K+ d- G
* J4 }5 n2 N+ P( @2 o7 l7 r8 [$ o, |& D r3 E! | U R
! s4 T G" g6 G8 {0 H8 F: b, b答案的源头是 2021 年的一篇“报道”,出自以假新闻和讽刺文章闻名的洋葱新闻。
" ]0 x2 V$ O" \1 p, u8 C' V* e
, z, A/ g6 n( N6 }
' C% c! `" A+ A4 s9 `AI Overview 也不精通美国历史,掉进了阴谋论的陷阱,说奥巴马是第一位***总统。
& Z: W5 x& f: X! {- k) b6 T2 ~ I
0 {- P0 c2 E; @! Q( ^2 ]" m
; Q; C6 R7 L# J# V' o1 p+ o% \' g1 B% T* d% d
% O' g. M) ?+ S7 Q$ h, x* y% @" ]8 n* o) b [& Z
一时间,X 等社交媒体掀起了一股抽象的浪潮:晒截图,比拼谁的 Google AI 回答最荒谬。
2 Z# n3 C) s& O5 x% o1 R" d3 G
! S! P! z/ {$ y2 k
) m# t' O$ v5 Q# w6 `( q$ s竞争异常激烈,在 AI 的世界里,前总统从威斯康星大学毕业了 21 次,一只狗曾在 NBA、NFL 和 NHL 打过球,蝙蝠侠是一名警察。
9 K* u4 A. H/ R# F% P& O4 w9 r; a3 z9 i- a6 i
2 Z6 S+ |9 b/ o- Y7 r( o乐子扎堆的地方,浑水摸鱼和颠倒是非的也不会少。; k" M7 d2 P u6 N5 y& [: I
: T% U7 P. x6 X' T6 ^3 m
; H1 {( U% W6 `# o9 O- w5 J% GGoogle 回应,大部分 AI Overview 的信息是高质量的,也提供了有用的链接供用户深入了解,很多“翻车”例子,问题是不常见的,结果无法重现甚至被篡改过。3 G9 s, k7 U% K" [+ n# [- n
3 ]* {6 P3 f4 ~" ^- N
6 H# n' v# `" F4 T/ Y
比如,一张流传甚广的截图显示,治疗抑郁症的方法是跳下金门大桥一了百了。事关人命,Google 特意解释了,这个结果是伪造的。% K3 h: ]" i( ?4 Z. D Y1 n8 h# e6 U
9 q3 p+ {" R& g& I! v; q* E/ S$ W' G" Z3 W: s0 K4 p5 M) ^
' r6 X0 a2 N/ E- P* q
被 Google 辟谣的截图
|) j G3 d7 b4 Y9 H" y6 X; E7 P5 e& d3 f
7 j8 V# K8 [) W' D8 z; k; o% e# ]
" J7 ]9 N, n8 _7 |; ^ ` `& Z与此同时,Google 没有辟谣其他例子,而是把它们作为改进 AI 的养料。怎么不算一次人类反馈的强化学习(RLHF)呢?8 }6 R& E9 q7 [" Q3 c0 N
8 e; {- ~; w, j N' B. }3 G7 C, f+ p: d
火眼金睛的网友还发现,之前 Google I/O 精挑细选的演示里其实也出现了事实错误,只不过更加隐蔽。0 f/ j, ^5 G. L# ^6 ]4 W1 U$ |# x
8 x5 i* p4 r+ ~# i( A' z4 F$ q" {
4 B/ R, {% X2 h: I被问到如何修复卡住的胶片相机,Google 建议打开后门并轻轻地取下胶片,但这样操作会毁掉照片。1 G' t1 s" ^4 M0 H4 i
( W- ]) V1 p" n0 d2 C8 X, H) d4 d1 z; m% z2 `5 d6 T
* U. F! C0 t8 k: Z
5 [8 k. M) B# P. l9 W) K& a7 y6 T4 v5 _# O- j* M. z" p7 Z/ w
流年不利的 Google,不是第一次在万众瞩目的公共场合犯错误。/ H5 v( Z2 j- p9 J3 e
& ~* E/ O! k: G
2 R7 k! J" c- t6 s7 j$ Y2023 年 2 月,Google Bard 在演示时说,詹姆斯·韦伯太空望远镜是第一个拍摄太阳系外行星的望远镜。事实上,第一张系外行星图像是在 2004 年拍摄的。一个错误,付出市值缩水 1000 亿美元的代价。7 W% [) }6 K/ V8 e; A, C
. J( U) A( R; ~2 O' u% |) c1 O; I7 r1 D7 W$ p6 y7 f6 ]
这次,除了 AI Overview 本身犯错,还有一个槽点:这个功能,它不好关。一些热心的开发者,赶制了扩展程序,强制只显示传统的搜索结果。
& h6 N1 h1 Y! b! g& l8 i( P3 z- t" t) @0 \$ G1 I, x: B( s% C
5 K6 t! n: T# I$ \没有方便的退出机制是 Google 的不对,AI Overview 基于传统搜索页面,用户量极大,万一有不熟悉 AI 的用户,盲目信任它的结果并被误导,后果就不好说了。
, O8 }5 t: ] z/ R+ O% l9 c5 y& Q! N0 Z$ y1 W0 p* ?' {- F( F
+ I- p! ?2 d; J! j* G7 y" w5 m* @“Google 怎么会错 30%?”
3 d8 M4 E0 S1 k
& F2 P7 ^, j# B d: I( f) z% t
8 \; z7 U2 P4 J4 }* W$ A% z5 E+ Q其实,AI Overview 被曝光的问题并不新鲜。AI 会犯错,早就是公开的秘密。* P4 }1 [0 z3 V
. H* E8 X5 y* b
/ Y& x. ^: }6 _0 C. C如同起到造型作用的“吸烟有害健康”,AI Overview 下方标注着:“生成式 AI 是实验性的。”ChatGPT 也小字提醒:“可能会犯错。请核查重要信息。”& ^2 o7 p" k. P+ i: U
9 f7 [! ?+ t$ r) U' D& N; M0 a) Y9 F+ w( N W
大语言模型的基础原理是,通过预测下一个单词或者短语生成概率最大的文本,有时可能会选择不正确但看似合理的词语,也就导致了虚假信息或者说“幻觉”。* B% Y% [$ L. P" o
2 ^0 e. `) f9 u1 H0 @7 t" K0 m: x- r0 `4 w
AI Overview 的胡言乱语也是幻觉的表现,它结合了大语言模型生成的语句和互联网的链接,可以引用信源,但不保证信源的准确。+ d+ c4 F4 I* h/ ?
! N6 |* w& [7 e* L9 U
5 R" z% M' h2 K" }7 A哪怕用到了 RAG(检索增强生成)等技术,将检索系统与生成模型相结合,限制回答问题的范围,也只能抑制幻觉,而非根治幻觉。3 t. l) `% T' |. ~
+ {( p! c+ H; T [
- T1 W5 c) j8 P, z( V. f" r并且,信源本身的可信度存疑。“美版贴吧”Reddit,由网友贡献内容,而非权威媒体。: \, H' E+ \" E
* M! Q Y+ V% r$ c' v s' m; k. B' W5 X) `" v: R
今年 2 月,Google 与 Reddit 达成协议,将其内容用于训练 AI 模型。当时就有人怀疑,会否导致“garbage in, garbage out”(垃圾进,垃圾出)的尴尬情况。
/ {* w1 J3 I3 g& n& B1 c" |$ [- ^* W# O ?+ D# G
) ~0 L1 W# \0 k
被“幻觉”困扰的不只 Google。去年 5 月,一位网友提问微软的 New Bing 时,答案明显错误,他点开参考链接时发现,作为引用源的知乎回答,居然也是 AI 生成的,遣词造句尽显 AI 风味,速度人力所不可及。7 D. k# z h' P- b& r0 s
- ]3 X1 N; D- l1 s, i% U
. X- @& h% l$ `/ @! A. s6 r' ^
1 Y5 g5 N& r1 l2 R1 n
/ f7 r* z1 \1 N! G' |
& p7 I- ~% V! m) N( V; }/ @7 MAI 搜索们是如何引用信源的,也是个让人费解的问题。当我用中文搜索“怎么给柴犬洗澡”,Perplexity 的信源是搜狐、YouTube、豆瓣日记、B 站,天工是知乎、百度文库,一时也不知道哪个更为权威,不敢轻信。
" I- |( `# h8 _
% W" a/ f' g0 q) I+ z9 A9 z$ J2 R. m& n4 A |0 {- S# @$ p4 J
既然 AI 搜索都有幻觉,为什么总是 Google 被架在火上烤?" z4 d$ W6 O9 s3 H( e' ^9 ~
% e0 o* Y9 c0 q9 w* A
7 e% H# G' ?1 l4 l: F& G创立于 1998 年的 Google,成为搜索代名词的 Google,身为 AI 巨擘的 Google,拉高了外界的期待,也必须承担犯错的后果。
' J! {- I1 A" A( U- j
& D) b9 D! X& {1 i) x- U6 w
: j' ~" X: ]: [( z" Z4 x' T' f/ a
: u6 j0 ]) e! _0 A% v0 L
9 i* R6 s0 @8 ]7 Y. V
- X' o$ V* M; ~% ] D3 v: p3 U9 L相反,Perplexity 的 CEO Aravind Srinivas 表示,轻装上阵就是他们的优势,字里行间还有些骄傲。5 \% Z6 Z, V9 T6 K5 G+ u9 f
- {- g) f: Z5 K
1 c2 [+ A! r( ~8 k& {9 b; m: @0 V! B
如果你使用我们的产品,80% 表现不错,你可能觉得印象深刻,但如果你使用 Google 的产品,只有 70% 正确,你可能会不解,Google 怎么会错 30%?+ C/ `. [) i5 N5 [5 J
, U* D% t& q+ k5 ^5 g1 Y' X4 i/ `4 R4 A% d
另外,AI 搜索也导致了用户认知上的转变。
4 S) N% k+ D6 x/ N5 ~, d$ i4 _* G! N! r7 N- q
$ D" G3 W/ |$ l1 ]: V
我们以前说“用 Google 搜索”,而介绍搜索的生成式 AI 功能时,Google 自己给博客起的标题是“让 Google 为您进行搜索”,主次微妙地倒转了。
- z; s( T) f4 O) M$ V9 [1 P9 E& q' O% `$ r% W' D2 C
4 B. ?) a) Y: `. t2 r8 X, l
过去,Google 展现哪些链接可以回答你的问题。现在,Google 自己用 AI 回答你的问题。- `$ ?# o4 F, L! J0 r
3 A* o6 k6 y* l J E' M
: r; ~1 y( h. T. q8 Q5 u$ x8 m) s: l* d/ e
传播错误信息的矛头,从信源本身,转移到了引用信源的 Google 身上。这口锅,Google 不得不背。1 t0 h, n. ?0 O1 N
7 c" v: {7 w6 ]
; L/ D% b1 R: z8 i/ SAI 搜索在提供事实之外,还有哪些可能性( F0 u) s1 d6 R2 @) Z, a
4 X% s# j# S; `( g: I' ~
$ b( q$ W# N3 h/ x. S9 Y0 ~$ [既然幻觉已然是前提,我们应该换个角度看待 AI 搜索,问自己一个问题:是不是我们的预期出了错误?; H2 U' W( I1 y# W" V
# a4 e6 J0 ?) a
n! C- x# H+ ]. F
其实在 AI Overview 被批评前,Google CEO 皮查伊就在近日 The Verge 的采访中提到过,“幻觉”问题仍未解决,甚至可以说是大语言模型固有的特征。
5 \' e9 b0 g) b; D6 m! o. \8 R9 s3 e, E1 ^7 F! ~
: x. h8 D$ o" z2 E8 \$ z他认为,大语言模型不一定是了解事实的最佳渠道,但这不代表大语言模型是个废柴,非黑即白的思维不可取,比如它可以创造诗歌、引入搜索。
- h: G6 a1 T* Q) u' O3 A3 I y$ G: R& b0 c0 h
3 U0 G0 W9 m8 G0 B7 [4 ]- c
CEO 接受采访也好,I/O 大会也罢,都是在向用户传递一个理念:不要只把 AI 搜索当作对现有网页的简单总结,AI 发光发热的地方还有很多。
8 T0 Z1 Z0 J! c3 R! N. Y5 C
, d. L4 }( T" t; D7 [2 |( ^8 p3 `# G5 x! `) F4 m6 [
但 AI Overview 没能让人满意,怪不到用户头上,相比演示,现在的 AI Overview 并非完全形态,很多功能还没有上线。
1 ~; k( W j4 J+ C) d7 q9 Y h0 A' A( B G
/ t% _: {& n+ u
Google 搜索主管 Liz Reid 在 I/O 展示了一个“多步推理”的例子,输入“找到波士顿最好的瑜伽馆,展现优惠信息,以及从灯塔山出发的步行时间”,AI 一步到位,以前要搜索三次的,现在一次就够了。3 c) N+ }( h: R) {
f% F- i3 X4 D2 e) K" q8 R$ K! G. D& R( t' @( d1 z
& ?. y: _9 ~/ R$ Q/ n
1 O8 O# ~ K' a T: ^) X9 E6 O2 ?+ B0 h4 O3 O
同时,AI Overview 未来还将有“规划”能力,比如要求 AI 策划三天的晚餐,用户可以直接拿到一份食谱,并在中途进行细化,加上“素食”等需求,然后导出到文档。3 d$ a& n" N. |7 s3 s
4 {' ~2 O+ @( q6 [4 [8 Z9 G! `8 m9 h- ^8 R
" t5 r5 O5 ?; U" A- H# C+ \+ C% X! R( T5 a
! i; \9 ^/ p# l+ I2 S) m& OGoogle 的思路,和其他 AI 搜索产品殊途同归——让搜索更加可视化、交互性和个性化,用人话而非关键词沟通,节省查找信息的时间,回答更加复杂和具体的问题。
& v: v- ]* |1 `
t% A' @- {1 n; J4 [" L( c H. Y# ~5 }" V: ]2 s% y" I0 T* d
秘塔、天工提供从简洁到深入的不同搜索模式,甚至可以给出大纲和图谱。
! L$ b% F3 A! [ e/ ^. b W
3 ?% N/ O7 I/ T1 v0 E
# Z7 |2 ]0 x9 K$ N7 U1 ~- {Perplexity 可以控制搜索范围,既能覆盖整个互联网,也能按照搜索需求,缩小到学术论文、YouTube、Reddit。
, o. n' J' W& C2 |' T2 g8 N6 b2 ^! c1 @6 l& R O; Z
3 G4 s: y* i+ A
但相对复杂的场景,AI搜索被寄予了厚望,毕竟它比起 ChatGPT 等多了信源,更加方便查证,比起传统搜索,又能进行更多的研究、创作、规划、头脑风暴。与其说是比传统搜索更好的百科全书,不如说更有 agent 的形状。
9 |3 `. \/ a$ i8 M/ n5 g' l
& t+ H( W! e* A! m/ e6 h! C7 w/ a1 z& s
当然,饼画得再多,AI 搜索的幻觉还是让人膈应。为此有人建议,安全起见,用生成式 AI,别只看摘要,再用传统的 Google 搜索检查一下。所谓风水轮流转,但大哥还是大哥。
: @+ Z+ }, x" v8 t+ j% r" s- U2 Z$ g. |* F: x+ V
0 l- }& s1 x3 d! |! ~ Q
; H) |2 K0 p# Y: v! f本文来自微信公众号:爱范儿(ID:ifanr),作者:张成晨
5 v9 K+ z9 e6 T9 n- B% r- W3 f- {7 Y1 m( I; c* t1 n1 f
『本文转载自网络,版权归原作者所有,如有侵权请联系删除』 |
|