找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

巢课
电巢直播8月计划
查看: 46|回复: 0
打印 上一主题 下一主题

让人吃石头、给披萨涂胶水,Google AI搜索疯了吗?

[复制链接]

211

主题

212

帖子

619

积分

三级会员(30)

Rank: 3Rank: 3Rank: 3

积分
619
跳转到指定楼层
#
 楼主| 发表于 2024-7-29 15:59 | 只看该作者 回帖奖励 |正序浏览 |阅读模式

EDA365欢迎您!

您需要 登录 才可以下载或查看,没有帐号?注册

x
福无双至,祸不单行,Google 又又又“翻车”了。
1 Z7 E4 U# E) q, R5 @( ^
+ s% t: s9 P6 P$ d2 g/ f' u' M: r
. r3 p* R4 O' r2 f2023 年 2 月,追赶 ChatGPT 的 Bard,公开犯了事实错误;2023 年 12 月,Gemini 侃侃而谈如同贾维斯,然而视频经过后期处理;2024 年 2 月,Gemini 生成多种肤色的历史人物,被批评歧视白人。/ n* ]  R' e% r
. Q+ x3 ]" _6 B% o5 s3 Y5 u

9 I/ y- c4 s, T( m7 B: ~这回,厄运降临到 Google 的看家本领——搜索。海外网友看热闹不嫌事大,甚至上演了一波斗图狂欢。, U) d  `9 C- i% B' \$ `+ P

6 r% g! f- ?8 m" C3 l) S
* K7 J6 I* y; J5 K/ n被群嘲的 Google AI 搜索,有种清澈的愚蠢# x% k1 [1 ?+ {; @. K0 q5 Y4 o
3 X: T0 @, s% X6 E& ^/ _0 Z
6 P4 ^/ q6 W3 R
过去不久的 Google I/O 大会,推出的其中一项功能是 AI Overview(AI 概述)。
) T7 v% t* |' M/ m+ M" D/ L1 E) a$ w% k& B% N) B
5 H$ `( x& W+ z4 n/ d" l6 V
顾名思义,AI Overview 在网页顶部生成综合多个信源的摘要,同时附有链接。
- S4 _9 W/ T& M: R2 v0 x4 |* K4 u) V! M1 }

7 t8 z$ H9 u2 A4 j% t0 |0 ~1 g! a7 Q- ~& @) q) ^" r# @- Y( D" n) t6 \
2 p% V! C, D$ |. e8 p

+ n1 q* z- D6 m. @( z6 ?5 f当时,Google 对 AI Overview 很有信心,宣布当即向所有美国用户推出,很快也会推广到更多国家,预计年底覆盖超过 10 亿人。
3 \+ Z" G9 M, u% ^/ x& B" {/ ~" `0 W8 Z: j

6 a( E# a1 d, [/ l然而没过几天,AI Overview 先在美国用户这里翻车了。
) N3 I) C  w0 V: T4 O( A, E  p% ~$ Q
7 n$ o. z* `. ]4 s8 \4 x9 R/ o. a
自制披萨的奶酪容易掉下来怎么办?) Y6 S' \# K4 }
. a: P. b1 _3 K3 Z2 z3 _3 J

3 F+ w  q: f/ E9 nGoogle 建议您,亲,往酱汁里添加约 1/8 杯的胶水即可。特意强调是无毒的,背后原因令人暖心。
% ~' m/ Y$ C* F0 @: F7 U! a- G( L1 d1 O/ ?) @
- C: J4 I& f4 ~! z" J! Q

  p' w3 ^9 y) O8 y' C2 f/ f& u& z1 E8 {. W* u+ M
9 l% Q* X, R8 T7 P8 r
Google 并非现编,而是从“美版贴吧”Reddit 一位用户 11 年前的评论照搬了答案,可惜它读不懂人类的幽默。: G; l" n% e$ z5 C2 l
5 W3 K8 }  d8 f( `- d' J0 F1 _1 r

: S) E, o# y7 P4 p4 J; @  I8 i8 n) O. X
) W4 O4 a7 B8 h( O7 x
, H' ?( I! w, u" p- ]  g6 b
人一天里应该吃多少石头补充营养?6 t/ D7 t6 ^) }) c( u( X; L
# s7 z% k6 b( @, j8 I; \4 n2 Q
& f# F6 F5 d, s! Q5 k7 o/ i
Google 没有反驳问题本身的不合理,一本正经地胡说八道,根据加州大学伯克利分校地质学家的说法,应该一天至少吃一块小石头,以便摄入维生素和矿物质。. q- k: P6 H2 C4 v
% u! y5 @2 r+ G, `) j( S

4 Z- C4 a" x: Z* O9 A3 i% ]$ T; C% k

# F% w- ]8 W: P; r
) \5 x2 M. ]2 u9 C3 `3 X答案的源头是 2021 年的一篇“报道”,出自以假新闻和讽刺文章闻名的洋葱新闻。( G3 n/ k- a, b, V7 x# S

- a1 G- G: O4 |2 |6 k/ O
5 u" U# ?& C3 e0 ~, Z( ?AI Overview 也不精通美国历史,掉进了阴谋论的陷阱,说奥巴马是第一位***总统。
  T3 {2 X1 W# \  R1 Z! @, ~4 E
, z- ]0 E$ y0 a( U: R: X9 j7 e! k$ {8 [; `; H9 C. n" |2 f# s: x

$ o8 A; X: Q# B6 S4 R* u
: \( x' P5 u5 |5 F
, [3 n' s! q0 C: T0 {- x一时间,X 等社交媒体掀起了一股抽象的浪潮:晒截图,比拼谁的 Google AI 回答最荒谬。6 l( c0 n( h, [3 S" w9 f$ J/ U

9 A' f. i8 N$ v- M: V
( R( {3 q: x5 ^6 S) V/ D竞争异常激烈,在 AI 的世界里,前总统从威斯康星大学毕业了 21 次,一只狗曾在 NBA、NFL 和 NHL 打过球,蝙蝠侠是一名警察。9 V$ t% P# K' X9 Q& R
9 m+ G: D3 w* Q/ x
/ G, @" U. C9 a) }% j2 b
乐子扎堆的地方,浑水摸鱼和颠倒是非的也不会少。- o6 [6 ~$ H' P% ^  R# K

- f: V! {$ O3 G7 P! ?
  z# F4 v1 H0 W* R- }! H; @$ oGoogle 回应,大部分 AI Overview 的信息是高质量的,也提供了有用的链接供用户深入了解,很多“翻车”例子,问题是不常见的,结果无法重现甚至被篡改过。2 M7 j; R2 {  V% l

- m; Z% h8 b! V; g! N& R5 ?
) _( Z- q  {' h) B" Y) M* `比如,一张流传甚广的截图显示,治疗抑郁症的方法是跳下金门大桥一了百了。事关人命,Google 特意解释了,这个结果是伪造的。
  O6 @7 i9 d$ A/ K( l: ~
+ T/ \1 M7 V! s; Q' I1 g. J- J2 a3 O: U; K

4 Y2 D; w& V9 h+ A3 Q4 S; w被 Google 辟谣的截图
/ O/ Q: f/ d* u; n
0 [! h# o9 H0 j; \4 q7 X, J  a
% m" [7 V; r2 y% e4 T6 s  ^- S# X  u3 v! F3 }' T  F
与此同时,Google 没有辟谣其他例子,而是把它们作为改进 AI 的养料。怎么不算一次人类反馈的强化学习(RLHF)呢?
5 g3 ]% L7 D: z% K# T+ G9 x) L$ ]/ Q6 R- `8 a8 J$ @& U

7 m/ {( \/ h+ d! S4 k火眼金睛的网友还发现,之前 Google I/O 精挑细选的演示里其实也出现了事实错误,只不过更加隐蔽。; Y4 s# y5 T+ s) m

( W+ N  z* b6 Y+ x1 T  P- K1 ~7 \0 C9 {$ y( o2 y# Z
被问到如何修复卡住的胶片相机,Google 建议打开后门并轻轻地取下胶片,但这样操作会毁掉照片。
$ T' c5 L/ Q% Z, A8 ]9 d- X5 x+ d( \

& m4 U4 l. U! d5 X" u3 l; ?6 s9 c

/ d6 Y1 ~% b9 o. d  Q4 \( K& ?" p" M* {- f* R
流年不利的 Google,不是第一次在万众瞩目的公共场合犯错误。# H4 x/ s7 T$ @9 T+ X" X2 r

3 d  A5 w  d' Q( W4 X* c6 b7 a) t9 Q1 h8 i
2023 年 2 月,Google Bard 在演示时说,詹姆斯·韦伯太空望远镜是第一个拍摄太阳系外行星的望远镜。事实上,第一张系外行星图像是在 2004 年拍摄的。一个错误,付出市值缩水 1000 亿美元的代价。+ L& V8 T# N7 \& |# ?
' x, v, A: H9 j6 e1 ~/ |2 q: K& J7 z, k
6 G: M: Z7 j0 ~) r8 B
这次,除了 AI Overview 本身犯错,还有一个槽点:这个功能,它不好关。一些热心的开发者,赶制了扩展程序,强制只显示传统的搜索结果。
# I6 b# p& x$ ^( ^/ x2 q9 E5 @$ B* u/ I4 u0 V! v& x  I3 i

% T( r& C5 r4 I( G没有方便的退出机制是 Google 的不对,AI Overview 基于传统搜索页面,用户量极大,万一有不熟悉 AI 的用户,盲目信任它的结果并被误导,后果就不好说了。
) \- v) u4 P) o! z, u1 r; \& p: k$ p% _) g* w

* M( G2 ?5 S+ P6 V, G“Google 怎么会错 30%?”
4 y- _. e# I+ T$ J& T1 [+ F/ x
$ t6 U( a7 G7 t7 T
& |# H: }: Y* X9 C/ {2 g其实,AI Overview 被曝光的问题并不新鲜。AI 会犯错,早就是公开的秘密。( N5 |- Z+ \& @$ L$ R

! r" u  H( {: j6 q& E# }( A+ O
如同起到造型作用的“吸烟有害健康”,AI Overview 下方标注着:“生成式 AI 是实验性的。”ChatGPT 也小字提醒:“可能会犯错。请核查重要信息。”
2 k4 ^1 K% H) S! p- V  Z+ F+ V& w& W+ s  @, \
; u% H! C) x, M- s9 F. @( g
大语言模型的基础原理是,通过预测下一个单词或者短语生成概率最大的文本,有时可能会选择不正确但看似合理的词语,也就导致了虚假信息或者说“幻觉”。- D; U$ `9 Z" X9 C$ M1 `$ t
, }; g1 [& C3 M7 L; j, T
: Y8 f. V3 y# P2 X: V1 Q- }( h
AI Overview 的胡言乱语也是幻觉的表现,它结合了大语言模型生成的语句和互联网的链接,可以引用信源,但不保证信源的准确。8 O0 s/ @0 l2 L: c3 K; a
+ Z2 i0 C2 X: N; H! t

, Z6 A! P% ]! E) N哪怕用到了 RAG(检索增强生成)等技术,将检索系统与生成模型相结合,限制回答问题的范围,也只能抑制幻觉,而非根治幻觉。9 ]- `- m0 j. P' K8 _  j: ^1 w# j

  G; c( M9 n" x% u2 W% E3 C
* {! ]* X$ a* s并且,信源本身的可信度存疑。“美版贴吧”Reddit,由网友贡献内容,而非权威媒体。
/ a' {' @- H5 d: u3 W! @- Y% a" l4 U5 ?3 k# F

! i" ]0 X) {( U/ a! @今年 2 月,Google 与 Reddit 达成协议,将其内容用于训练 AI 模型。当时就有人怀疑,会否导致“garbage in, garbage out”(垃圾进,垃圾出)的尴尬情况。) F, c+ o+ w; V5 K2 {' w

0 J8 T# a' {) \5 i2 |9 Y) ]( Q
& Q1 q/ n$ o- N. m) o7 y' K被“幻觉”困扰的不只 Google。去年 5 月,一位网友提问微软的 New Bing 时,答案明显错误,他点开参考链接时发现,作为引用源的知乎回答,居然也是 AI 生成的,遣词造句尽显 AI 风味,速度人力所不可及。
1 a. ]  i1 E( w) D. {: f) ~* L- W( P6 V8 @  Z* Z( b
  m" y- p: }9 A# q
5 D5 T, e, y4 |- g, ?

& o. D0 w/ ]# S8 P
6 t3 J" ^3 \. N7 IAI 搜索们是如何引用信源的,也是个让人费解的问题。当我用中文搜索“怎么给柴犬洗澡”,Perplexity 的信源是搜狐、YouTube、豆瓣日记、B 站,天工是知乎、百度文库,一时也不知道哪个更为权威,不敢轻信。
$ L6 q8 B  {6 X1 ]! q; P6 h0 i( {' x7 P! \* O: T6 Q* K  {8 G

6 i, H0 h; x: L, W# l既然 AI 搜索都有幻觉,为什么总是 Google 被架在火上烤?
: S" x& G5 h+ x8 o3 t; D- f: _7 I2 P0 d9 k

+ X% k/ t. e5 D5 z. ~. w* _! r) a/ g创立于 1998 年的 Google,成为搜索代名词的 Google,身为 AI 巨擘的 Google,拉高了外界的期待,也必须承担犯错的后果。' g5 y7 L& J2 n7 e

) Q4 j: I; O3 N- R" u! S' \
+ b+ m1 i/ e4 u( W1 ^
! L( G. Z6 p  `5 B* s$ b* S& H3 D. [' G: E

8 n9 _4 N: T! A2 g8 B* ^相反,Perplexity 的 CEO Aravind Srinivas 表示,轻装上阵就是他们的优势,字里行间还有些骄傲。
; G' G- _8 j# [. U/ q) m. y9 t2 f" A( y$ V5 L3 R

. `* U: s& d& ]
如果你使用我们的产品,80% 表现不错,你可能觉得印象深刻,但如果你使用 Google 的产品,只有 70% 正确,你可能会不解,Google 怎么会错 30%?
7 ~& ^7 c1 q7 l5 e

+ W+ x' `8 ~$ F4 |7 H$ v
) P" q  p* t1 x4 g) t' b% N1 ~另外,AI 搜索也导致了用户认知上的转变。
9 s6 _* e. l, R* Z" G
9 n6 p/ h& ^# R/ g4 O0 }
% A! N) Z- C& u+ w3 B, h我们以前说“用 Google 搜索”,而介绍搜索的生成式 AI 功能时,Google 自己给博客起的标题是“让 Google 为您进行搜索”,主次微妙地倒转了。
) }: O) T2 R, h7 \* Q5 i" ~/ D- _& r) {
7 K. {% h4 W, v- m8 h: ^! C
过去,Google 展现哪些链接可以回答你的问题。现在,Google 自己用 AI 回答你的问题。
! M7 R$ i# d, `
- {* p; t% T% u# y8 r4 Z- f* B! J* p; ^7 d" q$ E2 M
传播错误信息的矛头,从信源本身,转移到了引用信源的 Google 身上。这口锅,Google 不得不背。0 d# V5 x- b1 s1 U- e; q/ k! D
. D1 I: w  i# O8 V
6 X7 ^5 u( i" H, b- \
AI 搜索在提供事实之外,还有哪些可能性% M; m# Y! V& I! T1 ]0 B/ v" S
7 `" e0 t( J) `: \/ C
% F* q+ e2 K+ @; O) a, F: s
既然幻觉已然是前提,我们应该换个角度看待 AI 搜索,问自己一个问题:是不是我们的预期出了错误?
3 e( J' j( R5 N$ a  S4 E
5 g. i  N' y8 @- X# h) `9 R, F, E6 v$ x
其实在 AI Overview 被批评前,Google CEO 皮查伊就在近日 The Verge 的采访中提到过,“幻觉”问题仍未解决,甚至可以说是大语言模型固有的特征。7 r+ H" _7 F/ ]. B8 e8 R$ X8 ?

9 ~3 F) X7 Q# E# L2 m2 p+ J1 M* }) p! c6 J4 E' ?
他认为,大语言模型不一定是了解事实的最佳渠道,但这不代表大语言模型是个废柴,非黑即白的思维不可取,比如它可以创造诗歌、引入搜索。; n% u1 @2 G! k' \& w
' Q. j  K7 F0 ]3 Y4 [' ^

' X: M& Z: F$ d% P) @CEO 接受采访也好,I/O 大会也罢,都是在向用户传递一个理念:不要只把 AI 搜索当作对现有网页的简单总结,AI 发光发热的地方还有很多。
) V* l" s9 T* j% g/ f0 T
6 r+ Q$ K. I: H- B
: j- V4 C1 {% E但 AI Overview 没能让人满意,怪不到用户头上,相比演示,现在的 AI Overview 并非完全形态,很多功能还没有上线。5 `' g& T2 E$ x5 ~1 I1 o. ~: \* ?
; n; C9 h& _8 s7 G( X7 |. U
  g& B, Y/ u! ~& l' l, W
Google 搜索主管 Liz Reid 在 I/O 展示了一个“多步推理”的例子,输入“找到波士顿最好的瑜伽馆,展现优惠信息,以及从灯塔山出发的步行时间”,AI 一步到位,以前要搜索三次的,现在一次就够了。
! v8 {8 S' u) ~+ G% {
1 E+ H$ \3 D+ t4 `- U( \% v) H
4 Q/ H# I2 j2 v) O# Y( P3 a6 U; `' D" T) t9 ]* o* q
0 I! ~$ _5 K; U
9 w" ?; q! V  l! z' X9 q
同时,AI Overview 未来还将有“规划”能力,比如要求 AI 策划三天的晚餐,用户可以直接拿到一份食谱,并在中途进行细化,加上“素食”等需求,然后导出到文档。' S* ^' C" l/ u, N2 `2 ^$ n* C; X

" d: U' @5 J9 U, o7 M5 l2 o+ d% @- D9 m) d, z9 A8 C' X$ r4 J6 _

8 a/ ^/ X! J3 [; `& b/ S$ ]% l; z
  ~: g! L0 Z) o+ D  }) k. C- d  F5 E1 h
Google 的思路,和其他 AI 搜索产品殊途同归——让搜索更加可视化、交互性和个性化,用人话而非关键词沟通,节省查找信息的时间,回答更加复杂和具体的问题。+ e8 y4 C* `- `: X6 K# @* {
* V; H4 P; o; W- I
- E4 N8 x( O) \* I+ o  r1 b
秘塔、天工提供从简洁到深入的不同搜索模式,甚至可以给出大纲和图谱。- Z! T6 Z* i$ O( V& F# a

7 F6 x. I  E4 {5 \& Q( f
8 h9 z4 f/ z. _/ b; ZPerplexity 可以控制搜索范围,既能覆盖整个互联网,也能按照搜索需求,缩小到学术论文、YouTube、Reddit。# K( z! d$ P3 a( _# N
- j. B- z! C1 W$ j+ ~5 B# J

* Z! F! b/ c7 I- }但相对复杂的场景,AI搜索被寄予了厚望,毕竟它比起 ChatGPT 等多了信源,更加方便查证,比起传统搜索,又能进行更多的研究、创作、规划、头脑风暴。与其说是比传统搜索更好的百科全书,不如说更有 agent 的形状。
. G2 W: W" E5 r4 M" ]* i  i$ [2 p6 ]; g! v( ?6 P, Y

. u' F- r! }% f当然,饼画得再多,AI 搜索的幻觉还是让人膈应。为此有人建议,安全起见,用生成式 AI,别只看摘要,再用传统的 Google 搜索检查一下。所谓风水轮流转,但大哥还是大哥。
! e" C' i0 X5 G$ i5 X: E$ ^+ [6 V  @) q3 ~+ \$ W8 U1 P$ s0 T. n
: X1 z" W( j2 J- ]9 D5 u) G

1 W- B, ?$ p7 S, x7 T, O本文来自微信公众号:爱范儿(ID:ifanr),作者:张成晨
  w5 Z3 i" ~, I+ R, N3 y: |! y% ^
# X% X8 [: q: ~. a  o『本文转载自网络,版权归原作者所有,如有侵权请联系删除』
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏 支持!支持! 反对!反对!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

巢课

技术风云榜

关于我们|手机版|EDA365 ( 粤ICP备18020198号 )

GMT+8, 2024-9-19 09:09 , Processed in 0.059263 second(s), 33 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表