找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

巢课
电巢直播8月计划
查看: 44|回复: 0
打印 上一主题 下一主题

让人吃石头、给披萨涂胶水,Google AI搜索疯了吗?

[复制链接]

211

主题

212

帖子

619

积分

三级会员(30)

Rank: 3Rank: 3Rank: 3

积分
619
跳转到指定楼层
1#
 楼主| 发表于 2024-7-29 15:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您!

您需要 登录 才可以下载或查看,没有帐号?注册

x
福无双至,祸不单行,Google 又又又“翻车”了。/ ?' x! u& Y/ q8 C6 M. C) m: E" D( C& x
4 l% }: w7 U& \+ ^- ^, {
# k: ~: P( A2 K& R/ S5 @- _
2023 年 2 月,追赶 ChatGPT 的 Bard,公开犯了事实错误;2023 年 12 月,Gemini 侃侃而谈如同贾维斯,然而视频经过后期处理;2024 年 2 月,Gemini 生成多种肤色的历史人物,被批评歧视白人。
' n' s$ S+ ]& M$ \0 J% Q9 L+ I0 V% k: S; O, w& ]8 M8 ]5 L

7 `+ A' H9 X. a! L9 Q# Y这回,厄运降临到 Google 的看家本领——搜索。海外网友看热闹不嫌事大,甚至上演了一波斗图狂欢。
6 c) q7 c- {; R9 V- ]3 a0 o- x) O3 f2 U0 v/ j( @* ^" O7 c. N

  x- Q( l; O8 F被群嘲的 Google AI 搜索,有种清澈的愚蠢) B* g: K' P3 X* q9 {

) k! I! f& x. x  F/ |2 I# }' U3 D5 M6 ^% M( J$ o' a
过去不久的 Google I/O 大会,推出的其中一项功能是 AI Overview(AI 概述)。
  l+ z$ \& \# O3 U. [6 S& I7 @2 T: d1 m4 l
# [+ i' I1 o: g0 |+ V& L' C, q0 C5 S
顾名思义,AI Overview 在网页顶部生成综合多个信源的摘要,同时附有链接。" }, P# B+ R( u- O! P) B: _; {' H" _
1 g2 k) F; Z, p& q- ~% U
3 O  z( Y7 [" o  r: H' K

2 X8 F2 p" {3 s& s* W+ u, q7 h4 t3 I2 u. a6 J
/ b% w( @: X7 {0 B' E$ ~
当时,Google 对 AI Overview 很有信心,宣布当即向所有美国用户推出,很快也会推广到更多国家,预计年底覆盖超过 10 亿人。/ F: ]* w9 r% F% ]% R8 R9 S6 j

; @( @7 K8 S) ]+ B, v  w& i* Z* Y3 h* u5 N2 t
然而没过几天,AI Overview 先在美国用户这里翻车了。
. ^( y- T; {  Y1 \) f8 T! ~/ o9 c* R% x. f0 W, b

( N: Z! O' r& p& c4 h自制披萨的奶酪容易掉下来怎么办?; B: ]  i* u! f# e5 F  G
3 U. A+ x6 Z" ~+ B% |2 l/ K
9 t& D. i3 V5 ?& D) ^- @8 D
Google 建议您,亲,往酱汁里添加约 1/8 杯的胶水即可。特意强调是无毒的,背后原因令人暖心。
  h% u6 N6 S2 ]- T
* _' z2 \0 @7 u+ f9 p# s/ _% s* F. t" p$ @9 {/ A: c. H6 u4 i2 t
8 m* [+ g3 b7 h% j$ J8 L2 a5 W

7 q8 G5 z5 j- k" G$ S3 ~9 l, z- ^- J0 Z0 c! m0 P% p8 O
Google 并非现编,而是从“美版贴吧”Reddit 一位用户 11 年前的评论照搬了答案,可惜它读不懂人类的幽默。
' M, e3 H; m5 O
6 x6 B# I  k7 d) G  p9 C: P5 b* J# w3 {* y& l8 S$ k
1 S( ?+ f8 ]  Y. \5 V1 J

: \3 K* h. i, }/ f
) e) S2 w* l. A7 O人一天里应该吃多少石头补充营养?
: l$ p+ h  ?- A2 u
, s8 c9 ~5 `! A: P) x$ Y
: i4 g6 `# S( g3 T! ZGoogle 没有反驳问题本身的不合理,一本正经地胡说八道,根据加州大学伯克利分校地质学家的说法,应该一天至少吃一块小石头,以便摄入维生素和矿物质。
5 I$ E9 N& ]" \
$ \9 ]+ ^$ J; F6 u/ z# f" v' [: G5 a# c- V
& n6 g# @1 k/ D
4 n* G' A4 v6 m) U- i
7 y+ s3 ~9 {( D1 b/ w
答案的源头是 2021 年的一篇“报道”,出自以假新闻和讽刺文章闻名的洋葱新闻。* C, T+ g4 a6 l: W* x6 ^; e. U
8 g% H% v% |$ \) P2 w' Q! j
" _1 i2 d7 F! R  l
AI Overview 也不精通美国历史,掉进了阴谋论的陷阱,说奥巴马是第一位***总统。% c& w; `5 ~0 Q: k. k
0 }) p, e# Y$ m& z+ A1 ~
$ p, X! U2 E5 N" t$ M
! P4 l7 V" n3 k, k6 Q2 u
2 s: Y) }5 ?5 A9 O

7 e9 e( i# X' U, D0 N一时间,X 等社交媒体掀起了一股抽象的浪潮:晒截图,比拼谁的 Google AI 回答最荒谬。% m1 w! \9 L" D( z) U* u  h

1 S1 W* S( N  {8 s4 N
  z, u( p+ [7 G4 |2 u+ Y7 b/ P" ]竞争异常激烈,在 AI 的世界里,前总统从威斯康星大学毕业了 21 次,一只狗曾在 NBA、NFL 和 NHL 打过球,蝙蝠侠是一名警察。2 K/ P/ f: }! J! _  X# i; P5 Y

& s0 z: a0 ]1 |! v
1 M) u& ]0 D! \. ]( C乐子扎堆的地方,浑水摸鱼和颠倒是非的也不会少。+ K6 ?9 ~2 f1 {/ t5 A

. E+ N3 N0 `$ s
4 m: h2 B9 I( I, x" a7 U+ X8 u& a1 dGoogle 回应,大部分 AI Overview 的信息是高质量的,也提供了有用的链接供用户深入了解,很多“翻车”例子,问题是不常见的,结果无法重现甚至被篡改过。9 H; b& ~+ L$ C8 u! S" i

1 @9 b; K% C9 q7 N) m
7 \# p3 D) C$ G) i% K; ^, Q比如,一张流传甚广的截图显示,治疗抑郁症的方法是跳下金门大桥一了百了。事关人命,Google 特意解释了,这个结果是伪造的。
" M7 ?) C* R" a- i; |5 T) [% g* o2 @7 q$ M8 h: S6 D/ m$ C
/ t/ `5 o  g. X6 Y
5 _7 I$ J+ H; y  h8 U3 k- X
被 Google 辟谣的截图
+ l6 T+ I1 T# |: o1 M  K% S2 O0 {: p8 |8 _$ ~
. A" j4 h8 _+ e  C4 ^  c! b
" I/ r' M; o' _& l3 l
与此同时,Google 没有辟谣其他例子,而是把它们作为改进 AI 的养料。怎么不算一次人类反馈的强化学习(RLHF)呢?
3 @& r9 R% l4 Y' E0 \9 ], ~! s. A2 T2 N
1 |+ E6 t+ J! E$ w% i
火眼金睛的网友还发现,之前 Google I/O 精挑细选的演示里其实也出现了事实错误,只不过更加隐蔽。/ O8 L2 B2 s! M- o$ Z$ d/ l
0 g& Q4 _( o1 B

& x$ X; Z7 \. v( r# w被问到如何修复卡住的胶片相机,Google 建议打开后门并轻轻地取下胶片,但这样操作会毁掉照片。
. k$ p- V) `) f$ w' y& M# ^6 H1 G+ T7 i* p$ l8 t; B3 @" k% i+ T, j- E  H
9 z" R' ]3 E- M1 A" L. P  v% p
2 w, C- u( w  v4 ?3 h2 J  H, Q

! G+ a4 u1 \8 N* W- |, N: ?- I7 R$ v& c6 q# T
流年不利的 Google,不是第一次在万众瞩目的公共场合犯错误。
# Y  q8 ^2 N! e& J* F7 p" w, m3 v/ P
! S6 z0 A( X1 u: W5 i
2023 年 2 月,Google Bard 在演示时说,詹姆斯·韦伯太空望远镜是第一个拍摄太阳系外行星的望远镜。事实上,第一张系外行星图像是在 2004 年拍摄的。一个错误,付出市值缩水 1000 亿美元的代价。* q( T4 D1 K3 T

( P* M7 A. Z3 v6 ]% [  p' k4 `. G! U, E
这次,除了 AI Overview 本身犯错,还有一个槽点:这个功能,它不好关。一些热心的开发者,赶制了扩展程序,强制只显示传统的搜索结果。9 ]8 h' |# ]. \$ h

& m3 _  S- ]) y8 }; o5 K. p3 Q/ h" t" ]- Y
没有方便的退出机制是 Google 的不对,AI Overview 基于传统搜索页面,用户量极大,万一有不熟悉 AI 的用户,盲目信任它的结果并被误导,后果就不好说了。
( [5 p( a1 q5 V1 K; `* @% ]3 t: h) M9 m: k. H, x. @; C
* \0 V& P2 H+ b) ^
“Google 怎么会错 30%?”
& P2 E6 i& p6 @$ y0 O& `3 B
, s+ H/ Q4 @* q. b; L9 s( y( S. ^" @1 g1 w& m* ?
其实,AI Overview 被曝光的问题并不新鲜。AI 会犯错,早就是公开的秘密。5 B  }1 Y$ `+ _* k1 c: W! Z

0 Q1 N) A& h: p" }3 Q9 g; }+ a+ J- I0 Z
如同起到造型作用的“吸烟有害健康”,AI Overview 下方标注着:“生成式 AI 是实验性的。”ChatGPT 也小字提醒:“可能会犯错。请核查重要信息。”: R4 U; x7 o: B- q- O# n1 _
, \4 ]* C8 C6 X9 I! d7 _( I
# D2 g! I. ], _$ r' Y
大语言模型的基础原理是,通过预测下一个单词或者短语生成概率最大的文本,有时可能会选择不正确但看似合理的词语,也就导致了虚假信息或者说“幻觉”。+ x7 P$ ^: ^+ R7 m- q

5 i. O  D$ `( p2 ?; r8 `/ P7 p9 Q) |) E: e" v
AI Overview 的胡言乱语也是幻觉的表现,它结合了大语言模型生成的语句和互联网的链接,可以引用信源,但不保证信源的准确。: k* f5 W$ I: n) w- ?% A/ ^) K
- w4 X2 j" i3 J

: s& ~' H3 Y" m2 D& ?1 R- K" R哪怕用到了 RAG(检索增强生成)等技术,将检索系统与生成模型相结合,限制回答问题的范围,也只能抑制幻觉,而非根治幻觉。; }7 Q4 }5 }  k8 L- s9 @% a
! ?) m  }9 ?0 ?* j' F- u
4 o3 d9 ~' {) W" [" S& ?
并且,信源本身的可信度存疑。“美版贴吧”Reddit,由网友贡献内容,而非权威媒体。
! w7 E# v/ x/ n: }) {6 R
/ t" s. _" l4 Y/ _6 b/ ]' l( {6 G1 V& U. {5 o3 V. v$ d
今年 2 月,Google 与 Reddit 达成协议,将其内容用于训练 AI 模型。当时就有人怀疑,会否导致“garbage in, garbage out”(垃圾进,垃圾出)的尴尬情况。
4 N) [7 y9 g6 {, f4 ^% J$ w# t4 P) j' |/ p3 q% M8 B

, z( }; h: e- ?* D& `( Z" c8 y被“幻觉”困扰的不只 Google。去年 5 月,一位网友提问微软的 New Bing 时,答案明显错误,他点开参考链接时发现,作为引用源的知乎回答,居然也是 AI 生成的,遣词造句尽显 AI 风味,速度人力所不可及。
4 o2 S  p) u6 c- j. G) Y& y7 N3 c; e0 |

# ]& J, \7 n8 ]+ j/ j& J# V3 ]
8 \# d8 V/ P: |, Q+ X/ c4 m1 I  h- k$ i4 X
% M* i/ h2 v1 _/ u( F  g* y% B
AI 搜索们是如何引用信源的,也是个让人费解的问题。当我用中文搜索“怎么给柴犬洗澡”,Perplexity 的信源是搜狐、YouTube、豆瓣日记、B 站,天工是知乎、百度文库,一时也不知道哪个更为权威,不敢轻信。  V. R2 |2 V7 p

+ |5 A! W+ q3 g7 T- F$ {4 S' n" k" d# I
既然 AI 搜索都有幻觉,为什么总是 Google 被架在火上烤?: }$ u7 L$ P+ S- F

. z* O% d6 b# R& n
4 L- q- O# n! C0 g. l* L0 v) F创立于 1998 年的 Google,成为搜索代名词的 Google,身为 AI 巨擘的 Google,拉高了外界的期待,也必须承担犯错的后果。
2 l6 u! F/ T+ O' A
  h$ n8 ~4 E/ k5 a# @: P2 V) K' P6 D; u0 O) s, X4 i1 g
' K+ w$ U% K1 M3 k6 L, h' W9 W
" m: ~8 l, O0 }3 [6 h. R
. J* A; A5 V' g1 N" i1 T
相反,Perplexity 的 CEO Aravind Srinivas 表示,轻装上阵就是他们的优势,字里行间还有些骄傲。
& b& X) j7 ?2 A+ _# J6 C% V% A$ d5 q+ W
4 j+ ^( }3 g% d1 p5 M* u
如果你使用我们的产品,80% 表现不错,你可能觉得印象深刻,但如果你使用 Google 的产品,只有 70% 正确,你可能会不解,Google 怎么会错 30%?- }6 l/ v) E$ F) ~5 w: H
: t! E% U; n0 @! X; k$ o& H2 E) o

7 n7 V6 E+ l) U' h3 C+ P: t, S$ r另外,AI 搜索也导致了用户认知上的转变。$ F" r4 c3 ~& g$ @$ r0 B

, R, ^; A. J8 I3 l! |4 n4 ^  ~& s$ o( S; e& o
我们以前说“用 Google 搜索”,而介绍搜索的生成式 AI 功能时,Google 自己给博客起的标题是“让 Google 为您进行搜索”,主次微妙地倒转了。8 B2 Z; C) n* M3 i- b( p: e  k& L* X
  S/ w; e4 P% ?; J0 Y
) {) F: C% @9 s! z% k
过去,Google 展现哪些链接可以回答你的问题。现在,Google 自己用 AI 回答你的问题。
" A+ L& i/ Y9 L( o4 ?$ d1 t' h
7 h) m4 g+ |5 n: i3 ?: B0 [+ P: Q- d0 M2 _) W; o
传播错误信息的矛头,从信源本身,转移到了引用信源的 Google 身上。这口锅,Google 不得不背。
' |4 c, I8 }5 P9 O
# c; P9 m4 `. I# K  w$ g, j3 V
1 D7 S- \7 Z, q$ l# S& YAI 搜索在提供事实之外,还有哪些可能性
: @# d2 @- m' Z9 ~7 E! K* j" m
. v+ N: Y+ E9 N; @* V, g) R
6 |5 N8 [0 H2 G- Q* ^/ z既然幻觉已然是前提,我们应该换个角度看待 AI 搜索,问自己一个问题:是不是我们的预期出了错误?9 t) @% c9 S. {( S( O

/ J. B2 Z7 y! x( K" W1 m) R* r% i, Y: P
其实在 AI Overview 被批评前,Google CEO 皮查伊就在近日 The Verge 的采访中提到过,“幻觉”问题仍未解决,甚至可以说是大语言模型固有的特征。
6 s" J. l. t1 Q" K: {  Q" `2 {1 f6 ^4 I+ b
. X* z7 m7 J9 E
他认为,大语言模型不一定是了解事实的最佳渠道,但这不代表大语言模型是个废柴,非黑即白的思维不可取,比如它可以创造诗歌、引入搜索。7 }4 P2 @1 X1 V8 {( o# ^" R
4 G5 k, f* r" O$ d
  p9 m/ Y5 P2 |
CEO 接受采访也好,I/O 大会也罢,都是在向用户传递一个理念:不要只把 AI 搜索当作对现有网页的简单总结,AI 发光发热的地方还有很多。
9 L+ A4 ~+ Q: u- B1 g5 t& W5 t$ q  }/ m) p  G. U% I8 O

* l+ s8 h6 G) B. j0 S% j' {2 O7 F6 V但 AI Overview 没能让人满意,怪不到用户头上,相比演示,现在的 AI Overview 并非完全形态,很多功能还没有上线。
6 m. Z7 Y% _" d: \1 ~3 M  R
0 O: P1 E) o6 H' d! B2 E- A" I
+ R' H2 x/ ]8 D7 \# X2 U4 N9 ]Google 搜索主管 Liz Reid 在 I/O 展示了一个“多步推理”的例子,输入“找到波士顿最好的瑜伽馆,展现优惠信息,以及从灯塔山出发的步行时间”,AI 一步到位,以前要搜索三次的,现在一次就够了。2 e5 s6 ]( D( b' x' |) m' A

6 `/ K& ^9 n) T* j3 b2 T4 V  c. |( }5 T* Y: j! B
; w* |7 N& J6 q

; D9 k* [' f5 \% K/ X* b1 |& ^9 g% N' o3 |  T
同时,AI Overview 未来还将有“规划”能力,比如要求 AI 策划三天的晚餐,用户可以直接拿到一份食谱,并在中途进行细化,加上“素食”等需求,然后导出到文档。
+ j7 N, J7 h! i6 T% W$ m' x& B! X8 m/ S+ b: J+ C
; y: a  f5 a# L; I4 l$ S

9 W# N/ K5 N9 [; n! T# `1 `! t- t$ ~8 W! C

# Z1 }' f  b5 u2 }Google 的思路,和其他 AI 搜索产品殊途同归——让搜索更加可视化、交互性和个性化,用人话而非关键词沟通,节省查找信息的时间,回答更加复杂和具体的问题。
3 x) ~! J/ _( [/ m8 N2 `2 v4 g3 k/ V4 M, v0 ?4 g  f; N* k

1 t# h$ C* g6 G* a% }9 X7 g秘塔、天工提供从简洁到深入的不同搜索模式,甚至可以给出大纲和图谱。! i4 a# A2 W# N
, m/ W$ i+ T8 p, \
7 o  \- l6 B4 d
Perplexity 可以控制搜索范围,既能覆盖整个互联网,也能按照搜索需求,缩小到学术论文、YouTube、Reddit。/ W+ w) O) e! {& O1 h' ?( D

5 z: D9 t1 A$ v6 D9 p8 H
+ q8 M* q- Z# D1 c但相对复杂的场景,AI搜索被寄予了厚望,毕竟它比起 ChatGPT 等多了信源,更加方便查证,比起传统搜索,又能进行更多的研究、创作、规划、头脑风暴。与其说是比传统搜索更好的百科全书,不如说更有 agent 的形状。
+ z- y" K. K( Z) m1 d# I6 Z* ?6 w& _4 f6 D
4 T# b5 L% o# [3 J9 r
当然,饼画得再多,AI 搜索的幻觉还是让人膈应。为此有人建议,安全起见,用生成式 AI,别只看摘要,再用传统的 Google 搜索检查一下。所谓风水轮流转,但大哥还是大哥。
. e# p0 u) m6 z% t; h& R5 C  X. d& ~2 L3 @& R4 i
7 x- `, O5 C9 w9 ]* [
3 B% }' P6 H7 L" |
本文来自微信公众号:爱范儿(ID:ifanr),作者:张成晨& @  a) S- C; P3 V

, m! }7 e" h8 c. O『本文转载自网络,版权归原作者所有,如有侵权请联系删除』
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏 支持!支持! 反对!反对!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

巢课

技术风云榜

关于我们|手机版|EDA365 ( 粤ICP备18020198号 )

GMT+8, 2024-9-17 03:12 , Processed in 0.057836 second(s), 32 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表