找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

巢课
电巢直播8月计划
查看: 50|回复: 0
打印 上一主题 下一主题

让人吃石头、给披萨涂胶水,Google AI搜索疯了吗?

[复制链接]

211

主题

212

帖子

619

积分

三级会员(30)

Rank: 3Rank: 3Rank: 3

积分
619
跳转到指定楼层
1#
 楼主| 发表于 2024-7-29 15:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您!

您需要 登录 才可以下载或查看,没有帐号?注册

x
福无双至,祸不单行,Google 又又又“翻车”了。
4 X) j' w  Y- U' ?' G
7 B, W. j4 X$ H, ^% [/ Y3 e+ p
$ Y0 H9 M9 O+ ]/ C& \% s2023 年 2 月,追赶 ChatGPT 的 Bard,公开犯了事实错误;2023 年 12 月,Gemini 侃侃而谈如同贾维斯,然而视频经过后期处理;2024 年 2 月,Gemini 生成多种肤色的历史人物,被批评歧视白人。
6 X- @, a+ ~. ]' a' G4 T+ I. L. M5 A" i
' r6 `3 L% C' _
这回,厄运降临到 Google 的看家本领——搜索。海外网友看热闹不嫌事大,甚至上演了一波斗图狂欢。
3 O" n$ r( O6 D+ q2 o7 B0 B" q( O0 Q2 c; c; E
- e) [, B3 b; S" ^2 g5 u7 _2 a
被群嘲的 Google AI 搜索,有种清澈的愚蠢9 G9 j. T- a: {: j* o# h$ p

. L! }5 g) K% ]( i3 M- n8 Z* o3 O( ?* p1 s
过去不久的 Google I/O 大会,推出的其中一项功能是 AI Overview(AI 概述)。
  @0 n1 }  w& j, n) f3 r% \
: {/ E4 G4 |$ @3 q. y( ^
' E: `9 p2 E4 |- }( q顾名思义,AI Overview 在网页顶部生成综合多个信源的摘要,同时附有链接。3 s" Y) i- Y, u
; ^" B( z2 v# n/ w7 ]

1 `6 ?* x2 L6 C/ g5 J* X' c0 d1 l+ K' {9 y/ ?+ O8 j. L
0 G1 A* ]' m: o% t$ U2 Q$ G' y

% J# I3 s+ E' }' [当时,Google 对 AI Overview 很有信心,宣布当即向所有美国用户推出,很快也会推广到更多国家,预计年底覆盖超过 10 亿人。
/ a* o$ Z* ?6 _9 \( s) b  l( K( {( H# Q+ L8 _

( z' x, T2 |8 L+ U. i然而没过几天,AI Overview 先在美国用户这里翻车了。
9 j3 |7 d9 k( N; A7 y5 B. G) }  E6 y" u9 B1 w
5 W; Y7 N9 o, u% J7 ^1 o! a, q
自制披萨的奶酪容易掉下来怎么办?
4 K! I: C# A0 h$ z0 q9 A3 C* E* \% h( R/ V
9 q8 t& y7 ?1 B
Google 建议您,亲,往酱汁里添加约 1/8 杯的胶水即可。特意强调是无毒的,背后原因令人暖心。* e( ~# w! Y8 ^! D3 y

7 A) t& u( x. V5 K* n" Z' V6 w$ O5 Z' D; m$ t

5 M9 a: {) `# U  k' d! \. Y5 y& ^" i8 j8 d8 ~4 y$ E

. Y* I  z" c' f4 F( u$ L2 C* w2 RGoogle 并非现编,而是从“美版贴吧”Reddit 一位用户 11 年前的评论照搬了答案,可惜它读不懂人类的幽默。
, l3 t" d$ ~7 J; q9 B9 d% ?/ j' ~6 t* X- f1 P; t4 T: F) z" S3 U4 R- E

& y, P$ F0 `; x  p* U2 [; V( ^* U2 ]8 k8 d
0 M3 M& ~1 q( A% i! j5 U

6 |/ {8 ]. M4 L8 z& u" d人一天里应该吃多少石头补充营养?
% S2 {& P" `; m1 K: z# Q) \/ E& Y: Y! n; O. j4 L- Y# g$ k$ P( i

8 M, n) y- X* h& C4 YGoogle 没有反驳问题本身的不合理,一本正经地胡说八道,根据加州大学伯克利分校地质学家的说法,应该一天至少吃一块小石头,以便摄入维生素和矿物质。
% r& n+ }+ h2 M& j! H. T* F2 t( @- b

3 K' p! i; N  j, C' w. L, H3 I6 J! G+ n9 u- c, x1 [( {
' w) O7 X: @8 b2 k: r

4 K+ @6 E" s1 ]9 _/ y1 l% l答案的源头是 2021 年的一篇“报道”,出自以假新闻和讽刺文章闻名的洋葱新闻。
. k( c, ^6 @4 g* P& f
; Q% N6 r2 |2 Z- t0 f1 F- A" m7 ~) h/ d" G$ I. u8 O  y7 l- B
AI Overview 也不精通美国历史,掉进了阴谋论的陷阱,说奥巴马是第一位***总统。
# L/ D0 c5 e* q6 y
6 C+ g6 I" ^4 r! A4 K
# Z; }; f& s# W
2 K* `# [' ^; t) [5 ]
; f6 s- g, t, o! b
& Z9 z2 f! ~6 A; x) m# u* ^. @/ I5 t一时间,X 等社交媒体掀起了一股抽象的浪潮:晒截图,比拼谁的 Google AI 回答最荒谬。) E5 ]$ ~9 R4 Y6 |& V

( T7 j5 A  v* @6 o3 X0 |- c* E; b! C3 u- [
竞争异常激烈,在 AI 的世界里,前总统从威斯康星大学毕业了 21 次,一只狗曾在 NBA、NFL 和 NHL 打过球,蝙蝠侠是一名警察。4 T2 \4 D2 J) ^- h6 a; o" x) Q
0 @+ o- b& ]& z. Y% _) i
! p, x* t0 x) z) Q# Z1 l
乐子扎堆的地方,浑水摸鱼和颠倒是非的也不会少。% Y. J! X0 e# U

: x# I8 V* y: W7 n2 |% @
0 ~( m4 ]! ~  EGoogle 回应,大部分 AI Overview 的信息是高质量的,也提供了有用的链接供用户深入了解,很多“翻车”例子,问题是不常见的,结果无法重现甚至被篡改过。5 Q% x$ S7 e6 ~3 t& T

+ E/ p& i% N% j( Z7 E$ F$ E2 d# D, `
比如,一张流传甚广的截图显示,治疗抑郁症的方法是跳下金门大桥一了百了。事关人命,Google 特意解释了,这个结果是伪造的。4 V. A, Z1 l8 m; d

- W, [& o+ c2 {. l' @  c3 [+ w3 _- q+ V- {0 ]$ }3 b& D
& ~' O) L- K! ?* K. l; L
被 Google 辟谣的截图/ e* d' f! W+ _& Y& Y
4 d# d8 P1 \2 G& P% t  B; e/ ]/ a

+ p" C, X6 F  q# e+ {* \  z  m0 y) t  {8 e# [! Y
与此同时,Google 没有辟谣其他例子,而是把它们作为改进 AI 的养料。怎么不算一次人类反馈的强化学习(RLHF)呢?
  x1 x8 x4 [8 Y, X5 Y1 |
- f, l* |5 b  N. f) g
0 K' J0 C4 X& m7 ~# \6 U$ ^& k5 |火眼金睛的网友还发现,之前 Google I/O 精挑细选的演示里其实也出现了事实错误,只不过更加隐蔽。  p" Z8 n+ G5 A
$ B' N7 S) S7 e% ^

' V7 J. m1 w; ]8 Z被问到如何修复卡住的胶片相机,Google 建议打开后门并轻轻地取下胶片,但这样操作会毁掉照片。& B& a8 P' Y# V2 o

0 b8 C, C+ x0 ]5 ]* e2 H  r; O2 `; A$ ^

% F/ `! {* y* E5 U' M' |9 m) [' g0 x5 g: _
5 d9 Y) c6 n" h
流年不利的 Google,不是第一次在万众瞩目的公共场合犯错误。
4 i. B" y  O/ c
8 k0 X! w% g4 I# E4 `2 F
& H" Y4 D3 R$ X- }$ Z1 o2023 年 2 月,Google Bard 在演示时说,詹姆斯·韦伯太空望远镜是第一个拍摄太阳系外行星的望远镜。事实上,第一张系外行星图像是在 2004 年拍摄的。一个错误,付出市值缩水 1000 亿美元的代价。0 o$ I! Q# ~9 Z$ Y5 A+ [
3 j8 J/ B4 F1 P2 \- \! D2 |

/ g: D5 v3 l7 y$ Z2 H% M& R这次,除了 AI Overview 本身犯错,还有一个槽点:这个功能,它不好关。一些热心的开发者,赶制了扩展程序,强制只显示传统的搜索结果。. s: v6 l1 w" f. D5 b
9 G  B  ]; v9 K" q
4 ?; j/ j. e4 e- I: a. f
没有方便的退出机制是 Google 的不对,AI Overview 基于传统搜索页面,用户量极大,万一有不熟悉 AI 的用户,盲目信任它的结果并被误导,后果就不好说了。
. w0 [* r2 y, Q( O" q# R% ^  C9 n

7 J3 R' N5 ?1 \1 L! U“Google 怎么会错 30%?”
+ o5 P0 c2 T2 Z3 }3 T- H- |7 y! H4 {) @) E
" O) X+ ~8 `7 y  t
其实,AI Overview 被曝光的问题并不新鲜。AI 会犯错,早就是公开的秘密。
8 I4 E+ s# @$ J; ~* a7 D; @3 v( n0 z# m) h
. d2 }5 }% Z6 w4 l0 @# O
如同起到造型作用的“吸烟有害健康”,AI Overview 下方标注着:“生成式 AI 是实验性的。”ChatGPT 也小字提醒:“可能会犯错。请核查重要信息。”
/ x9 {* {6 i8 x# s$ v9 y
; W6 s( Q6 K  ~
% m8 I2 s+ n  I- [( D大语言模型的基础原理是,通过预测下一个单词或者短语生成概率最大的文本,有时可能会选择不正确但看似合理的词语,也就导致了虚假信息或者说“幻觉”。0 a% t$ ]2 q- a0 u' \

0 [) ]1 c" a: M( l9 l, ^7 d
: I" S# d9 ^% J) b9 U/ Y" V+ \AI Overview 的胡言乱语也是幻觉的表现,它结合了大语言模型生成的语句和互联网的链接,可以引用信源,但不保证信源的准确。& X$ _& ?& c2 _1 n6 Q4 B; Y

& }' B' O' x$ Y+ x1 w; r; f9 l/ E3 c8 C! s- q
哪怕用到了 RAG(检索增强生成)等技术,将检索系统与生成模型相结合,限制回答问题的范围,也只能抑制幻觉,而非根治幻觉。. F5 k; j5 L+ j: _; \2 V& i$ d
- }2 p% R4 I  e" ~9 O: N" B
, R* C" }' E6 T9 `" H
并且,信源本身的可信度存疑。“美版贴吧”Reddit,由网友贡献内容,而非权威媒体。- p/ x* y9 a9 @
4 G. [8 z- _; R1 H( Z

3 ~( w: @% n4 o' p; D+ Z1 \今年 2 月,Google 与 Reddit 达成协议,将其内容用于训练 AI 模型。当时就有人怀疑,会否导致“garbage in, garbage out”(垃圾进,垃圾出)的尴尬情况。( Z7 j" g- a4 n5 U2 j
4 }9 _. K5 q3 M1 |5 A" I1 e* P

! o3 {3 c. S1 B3 b被“幻觉”困扰的不只 Google。去年 5 月,一位网友提问微软的 New Bing 时,答案明显错误,他点开参考链接时发现,作为引用源的知乎回答,居然也是 AI 生成的,遣词造句尽显 AI 风味,速度人力所不可及。+ J: b9 M* O" K
% }+ X6 O$ E. d8 q
+ t3 k" \8 S; f
+ u, l2 }- R" y# w2 ]  A& j+ P1 l+ X
; h) b+ t7 |/ Z" p; z( \/ c
2 n( k  W1 `: K9 Q
AI 搜索们是如何引用信源的,也是个让人费解的问题。当我用中文搜索“怎么给柴犬洗澡”,Perplexity 的信源是搜狐、YouTube、豆瓣日记、B 站,天工是知乎、百度文库,一时也不知道哪个更为权威,不敢轻信。
* h. V1 @% r5 |) }- p3 y' v) x7 z) C4 J" w" X8 A

$ L7 h' j1 @2 {0 U4 J' ], A0 t既然 AI 搜索都有幻觉,为什么总是 Google 被架在火上烤?$ w1 z; f2 t- c4 \4 U4 l* ~
( V) J% R* S) `5 e2 d

0 T# `) s) U) h; @* _创立于 1998 年的 Google,成为搜索代名词的 Google,身为 AI 巨擘的 Google,拉高了外界的期待,也必须承担犯错的后果。
) t/ t) Z% S8 I* V" X$ J( L9 X9 k# F5 |& P( ]& x

0 a& {# |  l) Z, n3 e! j8 H% ?$ r+ b, E. L

4 r- y1 H) _3 m. L5 O
: O; e. o* ]: j- F7 B9 H相反,Perplexity 的 CEO Aravind Srinivas 表示,轻装上阵就是他们的优势,字里行间还有些骄傲。. k3 P8 A6 C5 I. b6 y

% @4 n' w; s9 M6 f, ^8 ~3 P: I
" Q1 w! G& ^  k" ^3 l# g
如果你使用我们的产品,80% 表现不错,你可能觉得印象深刻,但如果你使用 Google 的产品,只有 70% 正确,你可能会不解,Google 怎么会错 30%?
/ f5 S1 W, E: ?" o
% B* I* J; o& `; m

; ]. s$ |$ [/ T6 N另外,AI 搜索也导致了用户认知上的转变。
0 E; ^5 g1 L4 y' Y. P' z, v2 K9 d2 l5 R7 d5 h- _7 |4 i& }

. {: ~' g+ d$ W6 h% |我们以前说“用 Google 搜索”,而介绍搜索的生成式 AI 功能时,Google 自己给博客起的标题是“让 Google 为您进行搜索”,主次微妙地倒转了。
9 ]4 c! h# j" ~: |- N0 I, u1 Y! j. N3 D7 o
0 ]  M; V  D- g+ g) _2 ^
过去,Google 展现哪些链接可以回答你的问题。现在,Google 自己用 AI 回答你的问题。2 W8 y, o( `; _* a! U

5 l, E5 \+ a0 f" W6 K0 W& ~& V% f' o
! e% y* D' h3 S传播错误信息的矛头,从信源本身,转移到了引用信源的 Google 身上。这口锅,Google 不得不背。# G! f0 [9 `8 t  U; @
: D+ w3 U: O* y
8 c/ h/ ]4 R8 X( v2 e  s" X
AI 搜索在提供事实之外,还有哪些可能性
; ^8 W' p$ P" j  ]3 ?
6 Z: Z* {% O) C6 P0 Q6 l) Y( y0 p2 }" ^5 D/ y2 u! p
既然幻觉已然是前提,我们应该换个角度看待 AI 搜索,问自己一个问题:是不是我们的预期出了错误?: {, d- H+ z: ?; a
6 S+ ^; _0 N8 d
( Y3 d: Y. p% s
其实在 AI Overview 被批评前,Google CEO 皮查伊就在近日 The Verge 的采访中提到过,“幻觉”问题仍未解决,甚至可以说是大语言模型固有的特征。
! |. M& i9 p1 |
" R4 G9 N3 ~- W( }0 L' v
3 N4 V$ u9 m0 V% a# q  M1 p他认为,大语言模型不一定是了解事实的最佳渠道,但这不代表大语言模型是个废柴,非黑即白的思维不可取,比如它可以创造诗歌、引入搜索。
) C+ {3 f" J& @2 t3 X
1 k# S8 o, s, J
  X4 n' U, |2 p- ~9 fCEO 接受采访也好,I/O 大会也罢,都是在向用户传递一个理念:不要只把 AI 搜索当作对现有网页的简单总结,AI 发光发热的地方还有很多。
* A& E* J5 Q. j; g5 {; T- J% ]
3 w2 ]: I7 l/ {* Q; A3 p$ b- B: O3 T
但 AI Overview 没能让人满意,怪不到用户头上,相比演示,现在的 AI Overview 并非完全形态,很多功能还没有上线。
9 d0 i3 Q5 s. `* o8 {" O" {. l& W; r  ]' Z& I% U6 p# U7 W, Z: F

$ y6 g- N; k1 d0 N; n) g* R, l: ~' M. IGoogle 搜索主管 Liz Reid 在 I/O 展示了一个“多步推理”的例子,输入“找到波士顿最好的瑜伽馆,展现优惠信息,以及从灯塔山出发的步行时间”,AI 一步到位,以前要搜索三次的,现在一次就够了。: J8 Y, E- p1 v* ^. G- y
8 G  O# p3 R" K( V" z2 ]* A4 q
5 z* Y# V2 M. @, t
8 v4 a% ?. W3 N) F

) C( x( ^  _9 P$ S9 J
2 @4 ?2 u8 A( e: y同时,AI Overview 未来还将有“规划”能力,比如要求 AI 策划三天的晚餐,用户可以直接拿到一份食谱,并在中途进行细化,加上“素食”等需求,然后导出到文档。2 s& L9 H8 {5 Z- g0 l, @5 e! f3 k6 W
# g8 D. P* z; v2 `4 O3 J
3 G* E; L4 u5 Q+ I
0 ?+ U; }% M( S- \2 V& m8 O4 W- f

4 N2 l: F9 b8 r$ `% y6 ]' _2 ^- G1 X4 P5 B* z" ~  t
Google 的思路,和其他 AI 搜索产品殊途同归——让搜索更加可视化、交互性和个性化,用人话而非关键词沟通,节省查找信息的时间,回答更加复杂和具体的问题。2 J; A/ x) |, u# z
) ~) ?* h: S/ T. x  C+ P

1 `; ?, M8 N( _6 a% G$ E秘塔、天工提供从简洁到深入的不同搜索模式,甚至可以给出大纲和图谱。  E9 y% R6 V) ^, W+ t% P: J/ x
" ?: p% i  U, l5 K: Y& S

- c* r2 D! T" M7 V  cPerplexity 可以控制搜索范围,既能覆盖整个互联网,也能按照搜索需求,缩小到学术论文、YouTube、Reddit。1 g# ^& }1 C8 q# w/ q# R# ^

2 J+ d; S. y! w% r% W: V
/ ]# |8 q5 M# c3 d8 Y4 @* C  r% {5 R% Q但相对复杂的场景,AI搜索被寄予了厚望,毕竟它比起 ChatGPT 等多了信源,更加方便查证,比起传统搜索,又能进行更多的研究、创作、规划、头脑风暴。与其说是比传统搜索更好的百科全书,不如说更有 agent 的形状。) _, R. r* {( X5 Y0 n! |2 v3 O

% H" d% Z& m0 ?- Q6 g6 I1 O' D8 A6 `* _& {7 j5 d! {
当然,饼画得再多,AI 搜索的幻觉还是让人膈应。为此有人建议,安全起见,用生成式 AI,别只看摘要,再用传统的 Google 搜索检查一下。所谓风水轮流转,但大哥还是大哥。6 V" e+ `, n/ v+ R+ T1 E
) J9 h' D! f2 m" ~
5 [5 j) M* U% {3 }0 A! o' H( h

6 }2 s  W* V, ]3 v3 \& H0 b1 a本文来自微信公众号:爱范儿(ID:ifanr),作者:张成晨
$ \4 S" Z3 g0 i, S
# M. H" w& O8 ?2 U/ |$ O( |『本文转载自网络,版权归原作者所有,如有侵权请联系删除』
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏 支持!支持! 反对!反对!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

巢课

技术风云榜

关于我们|手机版|EDA365 ( 粤ICP备18020198号 )

GMT+8, 2024-9-21 09:18 , Processed in 0.056884 second(s), 31 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表