找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

巢课
电巢直播8月计划
查看: 47|回复: 0
打印 上一主题 下一主题

让人吃石头、给披萨涂胶水,Google AI搜索疯了吗?

[复制链接]

211

主题

212

帖子

619

积分

三级会员(30)

Rank: 3Rank: 3Rank: 3

积分
619
跳转到指定楼层
1#
 楼主| 发表于 2024-7-29 15:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您!

您需要 登录 才可以下载或查看,没有帐号?注册

x
福无双至,祸不单行,Google 又又又“翻车”了。+ w/ o3 d' G3 x) y9 q- V; n! T
% U0 C; @% d6 o( \3 b) F0 S
+ F: H! r! d5 M: G- e
2023 年 2 月,追赶 ChatGPT 的 Bard,公开犯了事实错误;2023 年 12 月,Gemini 侃侃而谈如同贾维斯,然而视频经过后期处理;2024 年 2 月,Gemini 生成多种肤色的历史人物,被批评歧视白人。% `$ Z5 q) K" Z2 ]& f

! S+ N7 F& U' r. V! j6 K  d$ @& W3 m/ X* \- J
这回,厄运降临到 Google 的看家本领——搜索。海外网友看热闹不嫌事大,甚至上演了一波斗图狂欢。
4 Z1 b3 }$ l' M1 @, Y0 P4 K% G- S7 Z$ l6 X( y+ k' z7 D
0 {1 \1 i4 F* l
被群嘲的 Google AI 搜索,有种清澈的愚蠢# d) v% ]: P4 E/ O

* U& m8 N! L/ s. [& c# C
* r7 B, H1 N! Z8 P( i# z过去不久的 Google I/O 大会,推出的其中一项功能是 AI Overview(AI 概述)。9 Y8 ~8 ]& \5 c

9 }5 Q5 P1 y4 ?* J  [2 W8 ~7 o
1 m* v( n, I9 y" T- ~4 d顾名思义,AI Overview 在网页顶部生成综合多个信源的摘要,同时附有链接。1 k1 A8 m& {+ F& n$ T' g

+ i6 o0 ?; ~/ q$ K# [8 Z' j& @* Z$ S1 K4 l! o& {
& h1 p) o0 C/ k, L7 {* l; I
% k7 x- _# {" ?& M& h
& j0 w! d, a- d% k9 G. V) A5 x
当时,Google 对 AI Overview 很有信心,宣布当即向所有美国用户推出,很快也会推广到更多国家,预计年底覆盖超过 10 亿人。
3 ?2 O% b* r% G) i! Z' ]) S- ?/ m- G# e6 `  ?
/ J7 P3 a; j4 D
然而没过几天,AI Overview 先在美国用户这里翻车了。! Q( z6 ~. f$ r

3 Y3 {2 |5 N5 v9 O2 f" ?$ E2 r# G0 v4 R8 P  I6 N+ s0 \4 `- S. C  Z
自制披萨的奶酪容易掉下来怎么办?: k7 r' L2 R6 n: O/ c, D9 j
! i' b0 d8 q3 a% j1 L: J
) A( @- b9 f+ `
Google 建议您,亲,往酱汁里添加约 1/8 杯的胶水即可。特意强调是无毒的,背后原因令人暖心。
+ \  A( L6 V2 N& z
3 w4 v' l0 G5 N8 S. ?6 o9 _0 i- u2 l

- ?$ ^2 _# ~' v  W& Z& y- W* k" W7 p$ b- G# V! b9 w: _

2 D% j. ~% n* I$ R; e3 aGoogle 并非现编,而是从“美版贴吧”Reddit 一位用户 11 年前的评论照搬了答案,可惜它读不懂人类的幽默。
( g4 f) s/ \  L$ [7 g* l, O! s( o/ l( w9 x& M2 N
" o7 ]; Y1 P0 M6 z3 D0 P* q( k

% Q( T$ i5 h- F% ?9 B* R. h. u1 K" ]/ ?6 y) X. |, l% m

) ~* x& P3 X4 Q6 h( X2 G; D人一天里应该吃多少石头补充营养?" i2 S6 S8 D9 s4 ]3 W, d! P- h
& I) ]6 d0 ~7 o. @% n. b* q$ y

& p' ^4 r2 P2 }; w/ M' UGoogle 没有反驳问题本身的不合理,一本正经地胡说八道,根据加州大学伯克利分校地质学家的说法,应该一天至少吃一块小石头,以便摄入维生素和矿物质。+ q; k, u! z5 Y( ]
3 o, \. j* g+ I5 w* F

) Q: [: ^- r; {7 U6 j% m6 X3 F" M. o2 D3 p) C

! i8 t( W- z# L- S
8 L# O, m! C5 U! M, c0 Z. z( Q1 u答案的源头是 2021 年的一篇“报道”,出自以假新闻和讽刺文章闻名的洋葱新闻。9 B% q. F! }5 G, F# i4 J! ^0 ?& L
4 I) K+ Z. X, ~2 f" \/ ~
- [" f( v5 |0 V8 ^/ r2 I, F
AI Overview 也不精通美国历史,掉进了阴谋论的陷阱,说奥巴马是第一位***总统。/ ]$ K. n0 I  ^. X  C
6 x8 U3 G& g: f3 |
( U. [) [: q6 j, V& R# n3 v! I
3 k% z3 @* Y; j) l% n

  O9 v9 r5 f; }/ N4 y1 Z) q6 H2 E* X7 ~! q/ V, J
一时间,X 等社交媒体掀起了一股抽象的浪潮:晒截图,比拼谁的 Google AI 回答最荒谬。; e/ d6 h0 k1 m% }

6 K+ D3 {+ e: U5 {. v& l7 f& ~7 R9 {; P1 s, [3 g
竞争异常激烈,在 AI 的世界里,前总统从威斯康星大学毕业了 21 次,一只狗曾在 NBA、NFL 和 NHL 打过球,蝙蝠侠是一名警察。: |8 A5 F, h3 V; |. V
& F1 x! h- N% e. a# Z
  a- i4 [" s8 O* o2 B: `( T
乐子扎堆的地方,浑水摸鱼和颠倒是非的也不会少。( _+ ~/ [( i4 B" T

" D( Z: w# w5 c% F* p! y9 G3 D
6 S" S+ a  c; x' LGoogle 回应,大部分 AI Overview 的信息是高质量的,也提供了有用的链接供用户深入了解,很多“翻车”例子,问题是不常见的,结果无法重现甚至被篡改过。
+ V9 D7 H( ]6 [6 ]) _" n' \, A3 x; z! ~% r+ M* ^$ f
' r7 v" n- q7 L. ~( r
比如,一张流传甚广的截图显示,治疗抑郁症的方法是跳下金门大桥一了百了。事关人命,Google 特意解释了,这个结果是伪造的。
$ q* i; Q2 V" ^8 b9 D2 I/ z0 Z4 G

+ N9 L/ s/ m' F+ U! C. X. |. I7 {1 ?2 ]- D
被 Google 辟谣的截图: r3 Z; H  c/ M# ~: n

9 n) H$ b, N) M
8 y" C( g- K" S: y8 b; y: \1 w
( K/ e: z5 R  ]% G' T( }7 i与此同时,Google 没有辟谣其他例子,而是把它们作为改进 AI 的养料。怎么不算一次人类反馈的强化学习(RLHF)呢?, R0 ^) }# E0 j' n
/ P7 [7 M( [) D% A1 W2 a& T( g% l+ X

3 x/ @; r5 m0 }8 m' G; Y火眼金睛的网友还发现,之前 Google I/O 精挑细选的演示里其实也出现了事实错误,只不过更加隐蔽。
, O0 S! x5 L- H2 @/ L
9 R" {6 f& G0 ]) s/ N. ~  ?, [; n
被问到如何修复卡住的胶片相机,Google 建议打开后门并轻轻地取下胶片,但这样操作会毁掉照片。
9 Q6 P9 t$ q7 A; A9 ~
: O5 o: c9 \+ I1 F1 v4 i" p# D, T: K0 p& c: J+ U
3 u) h: n3 T* H6 K: B5 h

, J. s) u$ P' {* F" t  B# h2 ^
" d' r5 b" p5 H( {流年不利的 Google,不是第一次在万众瞩目的公共场合犯错误。
% n) N) N% W; ^% k3 N( l
3 D/ Q5 M9 U' {: ?6 k5 ]% G
0 r; b: x* f' i- i1 W  k7 g' T2023 年 2 月,Google Bard 在演示时说,詹姆斯·韦伯太空望远镜是第一个拍摄太阳系外行星的望远镜。事实上,第一张系外行星图像是在 2004 年拍摄的。一个错误,付出市值缩水 1000 亿美元的代价。
% \1 v! z1 g3 D0 \" O5 Q& U% H( g# y2 d3 Q: ]; [! ~% U

( {9 p7 G5 |. U% x/ c# \' ^' j这次,除了 AI Overview 本身犯错,还有一个槽点:这个功能,它不好关。一些热心的开发者,赶制了扩展程序,强制只显示传统的搜索结果。: `3 F, x+ Q+ v4 j

: X8 k% M( `2 s* Z( e
: o  X. o, P% \: r没有方便的退出机制是 Google 的不对,AI Overview 基于传统搜索页面,用户量极大,万一有不熟悉 AI 的用户,盲目信任它的结果并被误导,后果就不好说了。
9 l* _* Z5 e% T* r" S# B
( s8 B6 w7 r7 R3 P; W3 @& O7 s! M" [
“Google 怎么会错 30%?”
. a: }" q( R/ s/ [1 d) I5 F" U5 {' n1 t  D

) ]% ?0 N! s& M" Z0 l其实,AI Overview 被曝光的问题并不新鲜。AI 会犯错,早就是公开的秘密。# e- i$ v: R- F( `. V0 y
& T5 `) D! C, L# l7 q# o

  H% b1 E3 @2 s6 L% X如同起到造型作用的“吸烟有害健康”,AI Overview 下方标注着:“生成式 AI 是实验性的。”ChatGPT 也小字提醒:“可能会犯错。请核查重要信息。”3 F% V- j# F* H/ r, s

" p1 `5 ^2 x: X! h, K% M4 ^
0 H7 N$ n  b# g2 F# P大语言模型的基础原理是,通过预测下一个单词或者短语生成概率最大的文本,有时可能会选择不正确但看似合理的词语,也就导致了虚假信息或者说“幻觉”。5 v1 Y( E  x; m, G; @  F

' a7 C; ?4 u2 h: Z  A$ A2 {3 f  k0 z$ C. M  t, C
AI Overview 的胡言乱语也是幻觉的表现,它结合了大语言模型生成的语句和互联网的链接,可以引用信源,但不保证信源的准确。
* Y; C/ J. `% P0 x8 L% A( G- i- Y) }1 {% d; Z( y0 {

* y! Y2 L# F- |/ {; G哪怕用到了 RAG(检索增强生成)等技术,将检索系统与生成模型相结合,限制回答问题的范围,也只能抑制幻觉,而非根治幻觉。( M+ w3 N) O4 b1 X
: ^* [+ G  D8 i! z6 f

4 ^8 U& r0 A' \7 Y- X+ `' `并且,信源本身的可信度存疑。“美版贴吧”Reddit,由网友贡献内容,而非权威媒体。- v+ S0 B" f5 m) y- ]4 n: i: x

" G5 v* s8 R4 ]  s: q3 I3 ?3 o) M
8 b  y, ]" p% b3 o8 ~今年 2 月,Google 与 Reddit 达成协议,将其内容用于训练 AI 模型。当时就有人怀疑,会否导致“garbage in, garbage out”(垃圾进,垃圾出)的尴尬情况。2 q4 S$ J6 g  {3 [: ]4 C! P
$ i4 J1 e! i( |2 L8 K
4 l. q7 V. W) [* v4 t
被“幻觉”困扰的不只 Google。去年 5 月,一位网友提问微软的 New Bing 时,答案明显错误,他点开参考链接时发现,作为引用源的知乎回答,居然也是 AI 生成的,遣词造句尽显 AI 风味,速度人力所不可及。
5 _) w& z$ q5 R: Q* d' d; Y* g- F: D# ~* ?1 J% H4 c/ G

6 W. ^. x; L2 h7 K1 M3 X7 [+ o: T4 f! p( z' q; t

8 {& F1 ~! p2 Z
2 ~: i9 Q2 x9 J& z& A3 Q& q9 pAI 搜索们是如何引用信源的,也是个让人费解的问题。当我用中文搜索“怎么给柴犬洗澡”,Perplexity 的信源是搜狐、YouTube、豆瓣日记、B 站,天工是知乎、百度文库,一时也不知道哪个更为权威,不敢轻信。
7 m, p4 q& g% x; @+ p8 X" n/ b# ~9 n
  s3 e. a& X% m, l" M
- y. c$ }, O2 {/ t& u( z) b$ Q既然 AI 搜索都有幻觉,为什么总是 Google 被架在火上烤?
) O6 _6 Q# W1 B6 Y8 U; a2 z  x1 P) j- ^. z. L

* Q# o  C* b7 S9 H: Z" _8 O+ j创立于 1998 年的 Google,成为搜索代名词的 Google,身为 AI 巨擘的 Google,拉高了外界的期待,也必须承担犯错的后果。% U6 p" Q9 n6 m) l" ~' j
8 i3 {3 l7 U* q. h! c( F
0 O3 H8 g+ N  p! l9 F

1 X3 I5 \$ ~: L
' b/ X1 H  d! @% a8 f* `* }- _* H" g
4 C9 }% @$ o$ K相反,Perplexity 的 CEO Aravind Srinivas 表示,轻装上阵就是他们的优势,字里行间还有些骄傲。* ~; Q4 c) ^$ `1 Q5 W

" ^$ v, S- X& c; f& q
- j; w# {+ a7 K' |
如果你使用我们的产品,80% 表现不错,你可能觉得印象深刻,但如果你使用 Google 的产品,只有 70% 正确,你可能会不解,Google 怎么会错 30%?" A9 U" x) r7 g. b% e

( D( @+ }3 n* \3 z6 Z  o6 E% h1 X: j8 l# t- l. y' z# |% m
另外,AI 搜索也导致了用户认知上的转变。
; m" D5 b) \' G0 T+ X
; `7 P4 z$ k; Y0 F
( D1 \' c: I* c$ R  o我们以前说“用 Google 搜索”,而介绍搜索的生成式 AI 功能时,Google 自己给博客起的标题是“让 Google 为您进行搜索”,主次微妙地倒转了。1 |0 D, R; W( U) A2 H! J

" t# k# H: K; l% O0 P  J" E7 y8 x6 F- ^3 A: n2 b- q
过去,Google 展现哪些链接可以回答你的问题。现在,Google 自己用 AI 回答你的问题。
% j- c8 p7 O' |$ L( b8 K+ [- s1 F+ v# j1 y) O
7 K4 f* E; w9 c" J7 b, x+ o
传播错误信息的矛头,从信源本身,转移到了引用信源的 Google 身上。这口锅,Google 不得不背。
. W  e2 `9 q% e' [0 h0 M1 ?3 E8 O  o
) z, U4 k' m, Y/ F
AI 搜索在提供事实之外,还有哪些可能性2 p8 r( ^/ E+ A! o6 |
/ l2 y! s, S; |2 \1 D
9 u' w( H0 r% y# [% E
既然幻觉已然是前提,我们应该换个角度看待 AI 搜索,问自己一个问题:是不是我们的预期出了错误?
6 q/ N0 k* F1 F7 M+ b. X/ F- ~- }: i. c: |! @: P

' M$ Q. L6 V" q0 l( \/ l: g% V其实在 AI Overview 被批评前,Google CEO 皮查伊就在近日 The Verge 的采访中提到过,“幻觉”问题仍未解决,甚至可以说是大语言模型固有的特征。" @& U# h: f9 e: ]: r; q
" d4 w. t2 i% |7 o% k9 O; r
1 P" [* S- r- ~9 U; X7 g
他认为,大语言模型不一定是了解事实的最佳渠道,但这不代表大语言模型是个废柴,非黑即白的思维不可取,比如它可以创造诗歌、引入搜索。% w# x, {' J  Z4 a

/ |; O0 _7 a0 ?
* }1 h) S6 I- v6 T7 V+ p" nCEO 接受采访也好,I/O 大会也罢,都是在向用户传递一个理念:不要只把 AI 搜索当作对现有网页的简单总结,AI 发光发热的地方还有很多。6 s5 ~$ ?/ V! q6 g" P* m: y7 }

  N! L2 @# c2 l" `) G/ i, D2 A1 F, [5 ]7 |, }' g2 n
但 AI Overview 没能让人满意,怪不到用户头上,相比演示,现在的 AI Overview 并非完全形态,很多功能还没有上线。
* b0 f) Q. q" S) i+ a
' \. t9 \  r4 G6 U3 d- N" `5 D/ h- v+ b  |$ y! s. O9 C& M
Google 搜索主管 Liz Reid 在 I/O 展示了一个“多步推理”的例子,输入“找到波士顿最好的瑜伽馆,展现优惠信息,以及从灯塔山出发的步行时间”,AI 一步到位,以前要搜索三次的,现在一次就够了。& L, `: \  h" p

% n2 I% f6 ~3 t/ ^" a# A  a* Y0 Y+ e2 X1 a* r; Z( E5 _

: o( r, W  C6 e0 n, C! C8 o2 }/ E7 I( d. |+ A. D% K
! G' r1 }  m! C+ @# y+ @0 q
同时,AI Overview 未来还将有“规划”能力,比如要求 AI 策划三天的晚餐,用户可以直接拿到一份食谱,并在中途进行细化,加上“素食”等需求,然后导出到文档。) B6 d1 h3 C; E2 }; X, s% `0 {& _% o

% x) U* c% M- Q" C% ]& H$ H0 S) y1 w0 R& Y' o* ?

" C: [0 L. g$ R' F8 K1 D$ S% g) z" u" u& F/ k% [5 U6 b0 L; V6 k

; a9 @/ B2 Z, t5 [6 D! mGoogle 的思路,和其他 AI 搜索产品殊途同归——让搜索更加可视化、交互性和个性化,用人话而非关键词沟通,节省查找信息的时间,回答更加复杂和具体的问题。
- H4 U* \# P7 q
5 U/ o3 R1 p8 a# b" I0 |8 p: N' h" @
& ?' U5 L7 R0 ]0 |8 S4 `* H秘塔、天工提供从简洁到深入的不同搜索模式,甚至可以给出大纲和图谱。
- w5 b' D  X$ t' A+ I. \0 f0 _# P5 s
6 y( w3 D9 k3 v& S* E' \8 j5 w: X
Perplexity 可以控制搜索范围,既能覆盖整个互联网,也能按照搜索需求,缩小到学术论文、YouTube、Reddit。9 F: ]3 A; [, ^$ u- B% H& C
/ [* b  ?( Z: b6 G
# B4 T1 d0 e, q3 Y
但相对复杂的场景,AI搜索被寄予了厚望,毕竟它比起 ChatGPT 等多了信源,更加方便查证,比起传统搜索,又能进行更多的研究、创作、规划、头脑风暴。与其说是比传统搜索更好的百科全书,不如说更有 agent 的形状。3 A0 [5 {6 j$ b5 Q$ }

. Q+ Q% ?2 x/ Y# t8 h# [0 ]+ d2 [; y
当然,饼画得再多,AI 搜索的幻觉还是让人膈应。为此有人建议,安全起见,用生成式 AI,别只看摘要,再用传统的 Google 搜索检查一下。所谓风水轮流转,但大哥还是大哥。- P$ @' d$ g. o! [6 l* j

0 D1 m# C2 Y, t6 ?/ w" }4 [5 W" R' Z, Q9 c9 c& U8 K+ ?8 d" [! W. r
# c( s3 J6 ]% \; f5 U: a) K0 R0 t
本文来自微信公众号:爱范儿(ID:ifanr),作者:张成晨! }- R( W' [/ a- e* q8 \! u
6 Q4 l7 X7 A8 m
『本文转载自网络,版权归原作者所有,如有侵权请联系删除』
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏 支持!支持! 反对!反对!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

巢课

技术风云榜

关于我们|手机版|EDA365 ( 粤ICP备18020198号 )

GMT+8, 2024-9-20 00:24 , Processed in 0.059304 second(s), 32 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表