EDA365电子工程师网

标题: 让人吃石头、给披萨涂胶水,Google AI搜索疯了吗? [打印本页]

作者: snowing303    时间: 2024-7-29 15:59
标题: 让人吃石头、给披萨涂胶水,Google AI搜索疯了吗?
福无双至,祸不单行,Google 又又又“翻车”了。& S+ M# k+ K# N0 g" E* F8 T% I

2 t5 G' x3 K5 j8 f7 ?% |7 B$ b- O; U7 D5 E- w1 |
2023 年 2 月,追赶 ChatGPT 的 Bard,公开犯了事实错误;2023 年 12 月,Gemini 侃侃而谈如同贾维斯,然而视频经过后期处理;2024 年 2 月,Gemini 生成多种肤色的历史人物,被批评歧视白人。
6 K$ n3 L2 x& }& h- g/ m& J/ R& @  y0 A- m# W2 v
& Y$ k8 e! a" Z' H6 V; e
这回,厄运降临到 Google 的看家本领——搜索。海外网友看热闹不嫌事大,甚至上演了一波斗图狂欢。
$ y' P: w) q, q5 ^8 p: A& {9 V1 N
7 ?# b( Z" Y' [) L: n. `; O+ H6 Q# `9 X" b1 D* ~- W. p' `
被群嘲的 Google AI 搜索,有种清澈的愚蠢: |4 Q3 M# l0 j# P# `
& `/ U  K2 a/ J; b9 m+ b+ r( r
+ h# d/ Z. u- X2 N3 L, n+ t
过去不久的 Google I/O 大会,推出的其中一项功能是 AI Overview(AI 概述)。
4 O8 j3 o' M, F8 S7 k! x) j
+ @7 G& P) w  N3 N. H, Y- {
! A. [! N' Q. x8 d  r% I顾名思义,AI Overview 在网页顶部生成综合多个信源的摘要,同时附有链接。) ^' u8 l" u7 W- T& Y: n" c

) F$ W# Q- b- y3 @2 T7 r2 w
$ D! W! W7 Q" q" t5 k' V
& p4 |; G# n# w* E7 U) x
2 n$ B0 `* W/ ^. l- x8 q
( E# c) q$ q6 S, M% p6 j. s当时,Google 对 AI Overview 很有信心,宣布当即向所有美国用户推出,很快也会推广到更多国家,预计年底覆盖超过 10 亿人。1 Y9 B1 W" B; D; Y2 c. j8 U
) a9 `. ]2 U; I1 f9 t8 P
% T! e+ C2 F9 H
然而没过几天,AI Overview 先在美国用户这里翻车了。
; G& r+ m6 C0 ?# L: i, ]" ^+ I2 Q" F  d& g
, g& C* d& e* z; `1 o$ t7 k' \
自制披萨的奶酪容易掉下来怎么办?
4 L/ {0 W* r) o" b, m- `; x8 [7 N
  O. Z5 I8 f; b5 \# G6 `; h- b2 n* ?7 v
Google 建议您,亲,往酱汁里添加约 1/8 杯的胶水即可。特意强调是无毒的,背后原因令人暖心。
2 A( [( M4 X/ h
7 P% k0 P* T# ]/ k- T7 b
# E  r6 f" U' y8 x
8 u; H" Q1 n/ [
" N7 i6 H4 G- @: ^
" o" l9 ]$ }) KGoogle 并非现编,而是从“美版贴吧”Reddit 一位用户 11 年前的评论照搬了答案,可惜它读不懂人类的幽默。7 h# H, c6 U) `) o$ |8 F
: w& @% S* H. _5 O
+ ?" I3 I- p2 d  n
; Y) n. L# l, X# p4 ~7 H9 m* ~
/ z4 h) q: R$ h' I6 T" p
( n1 x1 S+ S7 J( L5 h
人一天里应该吃多少石头补充营养?# L* y9 P. G) L0 [! u9 Z

. t2 o% ^$ ?' z) I5 D9 N/ q. \
! I; E, C8 w; C: @4 @6 V, sGoogle 没有反驳问题本身的不合理,一本正经地胡说八道,根据加州大学伯克利分校地质学家的说法,应该一天至少吃一块小石头,以便摄入维生素和矿物质。& |; C4 m% c5 d3 a: U

$ Z9 `" Q" v+ A7 G
: r  }7 s1 D) n, A/ n6 b7 N
5 @* \: P1 N7 V8 Z* P/ y3 E6 g/ h
& @) \/ i$ v1 V' ?" f4 y! y8 v+ h/ ^* D
答案的源头是 2021 年的一篇“报道”,出自以假新闻和讽刺文章闻名的洋葱新闻。
# V* |  _7 r) o6 \
4 [% h5 D6 m! x! n; D7 |1 K6 r- {) a7 h' u
AI Overview 也不精通美国历史,掉进了阴谋论的陷阱,说奥巴马是第一位***总统。& z; a: F5 X+ ^# {

$ i' {  V/ s2 S4 A/ U9 A% a% W7 X6 f/ \  [
9 p* ?3 y( ]4 n# s

3 h' T6 u. _% \2 h8 u* A9 D7 c( T) I  m+ X$ [0 R
一时间,X 等社交媒体掀起了一股抽象的浪潮:晒截图,比拼谁的 Google AI 回答最荒谬。
7 s$ r/ m. z4 g( P* A
2 j* r9 g* C  O" H$ g
2 O0 R5 ]) K' x( H4 h( U% H% t' V竞争异常激烈,在 AI 的世界里,前总统从威斯康星大学毕业了 21 次,一只狗曾在 NBA、NFL 和 NHL 打过球,蝙蝠侠是一名警察。/ r9 H- Q  F" }

4 W; S$ N( f" ~% s5 m+ o
$ N4 n* L2 [! s  r2 c% W% k. h乐子扎堆的地方,浑水摸鱼和颠倒是非的也不会少。
/ r: z+ Z& h% Z3 v- [6 r, a2 ^; V. {6 }! K
2 g+ r, H$ [! J) q+ [5 \5 z
Google 回应,大部分 AI Overview 的信息是高质量的,也提供了有用的链接供用户深入了解,很多“翻车”例子,问题是不常见的,结果无法重现甚至被篡改过。
- Y  c# E8 F5 K# i5 B1 ?- `0 @; T/ G

- b3 o7 ~. x# z5 L/ ?" t4 s比如,一张流传甚广的截图显示,治疗抑郁症的方法是跳下金门大桥一了百了。事关人命,Google 特意解释了,这个结果是伪造的。
' A" ~$ o5 N4 l0 p; H4 C. g
  V3 E2 m  ~( s: @" I# V' h0 q
+ O( t0 N! N" V" Y( R1 |& m
0 V# e# C' O5 o, k$ O( ?9 v0 x被 Google 辟谣的截图
6 x, Z5 d% C+ W8 L4 Z1 U9 p& |2 x

' A% E* f5 b7 w5 i4 x% r* x5 ~+ G: {6 w. d# `! V" `1 J
与此同时,Google 没有辟谣其他例子,而是把它们作为改进 AI 的养料。怎么不算一次人类反馈的强化学习(RLHF)呢?) C. t- `" l0 }$ J% T

5 W9 A/ ^9 N/ k# R' I% F! ^$ M. E# Z* z' f/ y; y1 D# D
火眼金睛的网友还发现,之前 Google I/O 精挑细选的演示里其实也出现了事实错误,只不过更加隐蔽。
  S  m7 M' L& A# o
  v6 O8 A) y4 P) t# Z9 b4 ?: O/ a) I2 Q9 l3 m
被问到如何修复卡住的胶片相机,Google 建议打开后门并轻轻地取下胶片,但这样操作会毁掉照片。3 p2 ^2 S% d+ g3 M1 ]. H
, P8 z& ]; K' F# G6 k8 ~

; ^. J# @( X6 i) j4 G+ P* E9 k- E1 t, o
' x  u+ _( t$ @2 ?# V: O
" d) c3 M9 s# c- O
流年不利的 Google,不是第一次在万众瞩目的公共场合犯错误。4 Y7 S: W- x! p6 ^" `
4 @2 y: Q0 H2 D/ _, s
7 C1 U4 q. d7 O$ m
2023 年 2 月,Google Bard 在演示时说,詹姆斯·韦伯太空望远镜是第一个拍摄太阳系外行星的望远镜。事实上,第一张系外行星图像是在 2004 年拍摄的。一个错误,付出市值缩水 1000 亿美元的代价。
2 Z2 ?) w2 m7 j$ z5 S
$ s& X- v0 @0 e& F" R6 s7 c6 e5 Q5 y) z
这次,除了 AI Overview 本身犯错,还有一个槽点:这个功能,它不好关。一些热心的开发者,赶制了扩展程序,强制只显示传统的搜索结果。
/ e5 o  Z5 |  l. U: ~" `
2 s+ d& `- l+ B3 b; g
& l  t9 g6 p2 y没有方便的退出机制是 Google 的不对,AI Overview 基于传统搜索页面,用户量极大,万一有不熟悉 AI 的用户,盲目信任它的结果并被误导,后果就不好说了。
' C" ~& M( u! R3 _$ T" i- ]* `5 Q
8 R0 D" ]  t$ I! t9 J% ?" _8 q+ i+ f% R/ N- N4 h
“Google 怎么会错 30%?”1 r+ H/ @) E3 G' ?
8 z2 d2 w$ m2 u6 ~! U( {' x( i' X8 ?
( v+ c5 Z$ x3 T/ x: y/ v, P
其实,AI Overview 被曝光的问题并不新鲜。AI 会犯错,早就是公开的秘密。
% b- q1 D# e- x* |" X  ?
4 v& ^. V  Z' j" T' R4 D, _& G. M; A. I8 D( h. d
如同起到造型作用的“吸烟有害健康”,AI Overview 下方标注着:“生成式 AI 是实验性的。”ChatGPT 也小字提醒:“可能会犯错。请核查重要信息。”0 V3 R& D8 `5 x9 ?1 \; K, n
. ]: ?1 B. ?' z, f4 I8 b6 ^$ O
/ k3 r1 b0 Q& h+ {1 W1 }
大语言模型的基础原理是,通过预测下一个单词或者短语生成概率最大的文本,有时可能会选择不正确但看似合理的词语,也就导致了虚假信息或者说“幻觉”。
8 L; B; ?6 |/ ~7 P. F3 T6 s5 V( s7 Y

$ w, r  ^: b  X% o% {AI Overview 的胡言乱语也是幻觉的表现,它结合了大语言模型生成的语句和互联网的链接,可以引用信源,但不保证信源的准确。5 O* n+ ~+ k, P) P  n0 J$ j5 g

, T. S% a. ^1 m+ w
7 n- O& l0 E1 H; G; Z8 l3 w5 o哪怕用到了 RAG(检索增强生成)等技术,将检索系统与生成模型相结合,限制回答问题的范围,也只能抑制幻觉,而非根治幻觉。
. s4 Y+ \: r/ l/ F" W* G, u) y0 j" L8 u- J  j% Y% \( g
* I" Z5 l% i+ p$ J
并且,信源本身的可信度存疑。“美版贴吧”Reddit,由网友贡献内容,而非权威媒体。  T$ y, R$ m+ `$ W
* I# H9 [& f0 T$ c+ H

: L! l/ E( \- L' a今年 2 月,Google 与 Reddit 达成协议,将其内容用于训练 AI 模型。当时就有人怀疑,会否导致“garbage in, garbage out”(垃圾进,垃圾出)的尴尬情况。
& m0 U4 s7 k8 p& s. Z' {/ x! L
7 f/ _9 N$ V2 t% u
1 `8 \: G; n* N0 `, c' h被“幻觉”困扰的不只 Google。去年 5 月,一位网友提问微软的 New Bing 时,答案明显错误,他点开参考链接时发现,作为引用源的知乎回答,居然也是 AI 生成的,遣词造句尽显 AI 风味,速度人力所不可及。
! B+ |' Y, t3 J& M" {- |2 m& `6 D* O, s; j8 z1 c0 |" W0 M

) Q$ {, h5 Y- Z/ r3 [$ z; {5 L3 r! b0 b  i

5 v- @" U1 R% ]* P5 e. r7 U& g8 D9 D, B1 u/ u% \. @
AI 搜索们是如何引用信源的,也是个让人费解的问题。当我用中文搜索“怎么给柴犬洗澡”,Perplexity 的信源是搜狐、YouTube、豆瓣日记、B 站,天工是知乎、百度文库,一时也不知道哪个更为权威,不敢轻信。+ @$ O% m4 O) t5 b, ]% J' b0 l- [
: ]" q$ H5 J. R1 n  ], Y. e

# w3 B6 o9 Y* U' k5 L2 B既然 AI 搜索都有幻觉,为什么总是 Google 被架在火上烤?
6 N9 G6 Z! w+ ]2 Y
' K! }7 y/ I+ r9 \! q% ~# `5 V+ R& l0 K* ~0 F6 |5 G
创立于 1998 年的 Google,成为搜索代名词的 Google,身为 AI 巨擘的 Google,拉高了外界的期待,也必须承担犯错的后果。
/ B. T2 M; ?" L. E' `/ S6 q- B0 [( Y" u& w; X

) Z' J$ R' |+ H& F0 H
3 {, U& R/ d& A
- P' R- d8 X& c/ O9 l0 W& Y- j. u4 a' x/ X5 v. a6 B# d: w9 Y
相反,Perplexity 的 CEO Aravind Srinivas 表示,轻装上阵就是他们的优势,字里行间还有些骄傲。# L2 L4 ~/ X$ j) T4 r: f6 B3 v" _
7 v- N4 H& @" i5 T9 s
! t% A  {; g, {1 j
如果你使用我们的产品,80% 表现不错,你可能觉得印象深刻,但如果你使用 Google 的产品,只有 70% 正确,你可能会不解,Google 怎么会错 30%?/ {5 s* |2 \) i& q

; W3 [% h) w7 D& `$ L$ I7 D. a9 e3 O, P  x- I" w. J
另外,AI 搜索也导致了用户认知上的转变。4 G) T5 i' ^) w" W7 v; @+ U
9 @4 V/ x7 X$ W" n9 q  T6 F
+ V) r. p. W, F- _
我们以前说“用 Google 搜索”,而介绍搜索的生成式 AI 功能时,Google 自己给博客起的标题是“让 Google 为您进行搜索”,主次微妙地倒转了。6 m# ]7 k1 i6 M( m/ q; I
: a" a% U( Z  N/ S8 d& ~; A

) P1 m- S: e3 A过去,Google 展现哪些链接可以回答你的问题。现在,Google 自己用 AI 回答你的问题。
7 Z' k$ {0 `( x* l; B7 }+ z2 s1 m, x
+ {6 e: ^1 k& i7 f
9 T+ Y: Y2 m% U传播错误信息的矛头,从信源本身,转移到了引用信源的 Google 身上。这口锅,Google 不得不背。
( m9 L, |! l  ~) R2 l1 b# d4 ?* G" [/ g0 N

" u) `$ d) B: a* hAI 搜索在提供事实之外,还有哪些可能性
8 D' \/ P) J/ T$ L8 ]7 h
% R1 s  ~7 j4 E& }5 b7 ]7 n/ m2 ^1 Y4 M! e* K0 M
既然幻觉已然是前提,我们应该换个角度看待 AI 搜索,问自己一个问题:是不是我们的预期出了错误?1 W. v- o) m5 C
/ C% Q4 Q8 C. f! w  x4 B4 x
" j# A0 p6 U$ |! F: E
其实在 AI Overview 被批评前,Google CEO 皮查伊就在近日 The Verge 的采访中提到过,“幻觉”问题仍未解决,甚至可以说是大语言模型固有的特征。
' J8 P: {9 X0 ~8 y, D7 t4 C% g6 E9 X8 y" T8 z' a% B1 z

4 @4 S6 q$ l4 ?+ {  ~4 ^0 z& W( }他认为,大语言模型不一定是了解事实的最佳渠道,但这不代表大语言模型是个废柴,非黑即白的思维不可取,比如它可以创造诗歌、引入搜索。+ _7 h) @$ Y: d% ]; }  }% L8 w1 z
6 |3 U- ^' d. d0 H# M0 J$ s4 K6 l

1 D! h3 u) C4 ACEO 接受采访也好,I/O 大会也罢,都是在向用户传递一个理念:不要只把 AI 搜索当作对现有网页的简单总结,AI 发光发热的地方还有很多。2 ~  S! v, v9 a+ Z; p8 i' X8 M* X
/ t& a9 G$ E6 p* E, i
1 I7 I2 {& B5 r! z( n4 |- r
但 AI Overview 没能让人满意,怪不到用户头上,相比演示,现在的 AI Overview 并非完全形态,很多功能还没有上线。7 P# P4 l9 P0 G0 o
% g1 \/ t0 Z3 j) X% d
; e5 ?1 g. H  c
Google 搜索主管 Liz Reid 在 I/O 展示了一个“多步推理”的例子,输入“找到波士顿最好的瑜伽馆,展现优惠信息,以及从灯塔山出发的步行时间”,AI 一步到位,以前要搜索三次的,现在一次就够了。
% z! B0 G* {( b& c/ u2 h* _/ m8 D* K7 b0 H8 j$ `
6 b! L5 G; x0 ]2 Y4 d

% s3 O8 {7 |7 ^( s/ s& E  Z6 k& x4 z4 Q0 N
" v: @7 ^9 Z8 K, c& k
同时,AI Overview 未来还将有“规划”能力,比如要求 AI 策划三天的晚餐,用户可以直接拿到一份食谱,并在中途进行细化,加上“素食”等需求,然后导出到文档。% V. l4 Q! r0 O6 n& q3 k, \+ m

/ X$ R9 c9 R) r' [( @# H# X0 j. O  v2 E/ P( \5 l5 s  h+ s

& N. b5 n( D. U! k9 o3 S) y4 t. `# O; \! w
+ d; Q2 `- [4 h3 q3 N0 ?) E
Google 的思路,和其他 AI 搜索产品殊途同归——让搜索更加可视化、交互性和个性化,用人话而非关键词沟通,节省查找信息的时间,回答更加复杂和具体的问题。
9 @# R9 V* z9 Q6 j0 _! i7 ^
& u6 ]3 f, `* j4 H7 ?
& h2 [2 x% Q* @. o, P秘塔、天工提供从简洁到深入的不同搜索模式,甚至可以给出大纲和图谱。
# w: X; I2 L0 J4 v) P8 M) D6 y
) b) u) J& m: `
" Y9 H1 J. D: G8 _) ZPerplexity 可以控制搜索范围,既能覆盖整个互联网,也能按照搜索需求,缩小到学术论文、YouTube、Reddit。/ b# v$ V, g$ V2 E5 g
) C$ `& e2 I$ M0 l& P

0 S& Z. o3 f3 m) B但相对复杂的场景,AI搜索被寄予了厚望,毕竟它比起 ChatGPT 等多了信源,更加方便查证,比起传统搜索,又能进行更多的研究、创作、规划、头脑风暴。与其说是比传统搜索更好的百科全书,不如说更有 agent 的形状。6 ]" r) `, a- e1 z
, t9 u4 Q9 C$ u0 Z9 f
  ~2 I! y4 D5 L. _) q+ r0 u( Y3 ?
当然,饼画得再多,AI 搜索的幻觉还是让人膈应。为此有人建议,安全起见,用生成式 AI,别只看摘要,再用传统的 Google 搜索检查一下。所谓风水轮流转,但大哥还是大哥。; n. S8 R# P: H2 ?$ M& a

/ M6 k; `/ D, l! s+ k+ `
6 h9 s) O; w3 m' X$ R/ g- R0 ]4 O3 j" f
本文来自微信公众号:爱范儿(ID:ifanr),作者:张成晨6 z: G! h3 \( F% S4 f$ E
/ `5 Z0 j$ F" H+ _5 ~. _
『本文转载自网络,版权归原作者所有,如有侵权请联系删除』




欢迎光临 EDA365电子工程师网 (http://bbs.elecnest.cn/) Powered by Discuz! X3.2