一本书读懂ChatGPT

微信读书

感悟

1
周日 2023-06-18,耗时61分钟。

笔记

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
《一本书读懂ChatGPT》
石子言 姚芳
36个笔记

# 第一章 ChatGPT的前世今生

>> ChatGPT的全称是Chat Generative Pre-trained Transformer,是一种革命性的人工智能语言模型。它由OpenAI开发并于2022年11月正式发布。

# 第四章 ChatGPT的典型应用

>> 问题:我要去西安玩,做一个五天四夜旅游攻略,早上10点后开始,日程不要太满。

>> 问题:写一篇张居正的人物传记。

>> “如何制作意大利面?”

>> 问题:创作一首七言绝句,押一韵。

# 第五章 ChatGPT与Web3.0

>> Web3.0,又称“下一代互联网”,表示互联网发展进入新阶段。它是以区块链等技术为基础,以用户个人数据完全回归个人为前提的智能化、去中心化的全新互联网世界,相较于现在的互联网,会更为开放及实用。

>> Web1.0时代,人们只是个旁观者,而Web2.0时代,人们变成了互联网建设的参与者,未来的Web3.0时代,人们将会与移动互联网建立更为“亲密”的关系。

>> Web3.0可用于以下几个方面:一是元宇宙(Metaverse),一个3D渲染的无限虚拟世界;二是区块链游戏,它们允许用户拥有游戏内资源的实际所有权,遵循NFT非同质化(代币)的原则;三是隐私和数字基础设施,这种用途包括零知识证明和更安全的个人信息;四是去中心化金融,这种用途包括支付区块链、点对点数字金融交易、智能合约和加密货币;五是去中心化的自治组织,社区成员拥有在线社区。

# 第六章 ChatGPT与内容时代

>> 艾伦·图灵思考问题的方式和常人相反,在20世纪30年代中期,艾伦·图灵就在思考三个问题:世界上是否所有的数学问题都有明确的答案?如果有明确的答案,是否可以通过有限的步骤计算得到答案?如果有可能在有限步骤里计算出来,那么假想,一种机械让它不断运动,最后当机械停下来的时候,那个数学问题就解决了?

>> 从技术角度来看,ChatGPT本质上只是一种基于机器学习的算法,它缺乏人类的情感和判断能力,也无法具备人类的智慧和创造力。ChatGPT不可能完全取代人类文明,只能作为一种辅助工具或者服务于人类的工具。另外,人类文明不仅仅包括语言和文字,还包括各种文化、艺术、科技和社会制度等多个方面,这些都是人类创造和积累的历史遗产。虽然ChatGPT可以在某些方面取代人类的工作,但它无法替代人类文明的整体,因为人类文明具有多维度的复杂性和多样性,这是机器无法复制和替代的。

# 第七章 ChatGPT与搜索引擎

>> 搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成,基本上这个架构图就可以涵盖搜索引擎的大致工作了。

>> 
图7-1 搜索引擎技术架构图


>> 我们现在正处在一个信息过载的时代,全世界每年产生1EB(艾字节)到2EB信息,相当于地球上每个人每年大概产生250MB(兆字节)信息。

>> 每天有100亿个搜索查询,但据微软估算,其中一半没有得到回答。这是因为人们的想法越来越五花八门,搜索引擎传统的设计理念已经跟不上时代了。特别是当人们查询更复杂的问题或任务时,使用传统搜索引擎的效率很低。而新版Bing和Microsoft Edge,让这些问题不再是困扰。新版Bing的主页有很多微妙的变化,首先是搜索框变大了,可以输入多达1000个字符的查询。新版Bing并不是直接在搜索引擎中融合了ChatGPT的能力,而是在保留传统搜索方式的基础上,在搜索结果页面的右侧,直接加了一个像ChatGPT Tab的标签栏,用户可以点击进入和ChatGPT类似的聊天页面。通过引入聊天功能,新版Bing变得更像个人助手。你可以让它帮你完成旅行计划、购物研究等。例如,当你想买一台65英寸(1英寸≈2.54厘米)电视,右侧会一口气列出2023年最畅销的65英寸电视清单。你可以在消息框中最多输入2000个字符,提出完整的问题,与Bing自然地交流,了解更多你想知道的信息。Bing可以记住所有的聊天记录,所以你不需要重新输入在此前聊天过程中提到过的信息。

# 第八章 ChatGPT与元宇宙

>> 随着ChatGPT的兴起,像DOKI一样的虚拟主播、虚拟导游、虚拟客服等虚拟数字人屡见不鲜。专家们认为,ChatGPT为虚拟数字人注入了灵魂,甚至大胆猜测,2030年以前,人类可能拥有另一个数字化的自我,像电影中的“阿凡达”一样,人类可以在这个数字孪生体中进驻自己的意识,还能与他人的虚拟替身连接互动,并对真实世界产生影响。

>> 元宇宙,由“Metaverse”一词直译而来,最早出现在美国著名作家尼尔·史蒂芬森(Neal Stephenson)的科幻小说《雪崩》之中,由“meta”(超越,高于)+“verse”(Universe,宇宙)组成,有“超越宇宙”,即“宇宙的宇宙”之义。这位熟知计算机网络和黑客技术的作家在书中描绘出了一个平行于现实世界的虚拟数字世界——元宇宙,人们在元宇宙中都有各自的数字化身Avatar,能够不受真实世界中时空上的限制自由交往,并和现实社会紧密联系。

>> “我们都曾年轻,我们也终将老去”

>> 1984年,美国科技达人杰伦·拉尼尔(Jaron Lanier)最早提出了“Virtual Reality”(虚拟现实)的概念,他用VR这个词概括了科学家们研究探索了多年的一些相关技术,并创立了第一家VR创业公司——VPL研究公司,采用眼镜、头盔、手套等一套设备将VR技术成功付诸应用

>> 1989年3月12日,英国计算机科学家蒂姆·伯纳斯·李发明了互联网的雏形——万维网(World Wide Web, WWW或Web),一个自动化的信息共享平台展现在世人面前

>> 随着微软公司第一代浏览器——IE浏览器的发布,互联网成为普通民众获取信息的新途径

>> 1992年,尼尔·斯蒂芬森在科幻巨作《雪崩》中,创造了“元宇宙”一词,被认为是元宇宙的开端。

>> UGC(User Generated Content,用户生成内容)

>> 2009年1月,比特币网络诞生,比特币不仅成为区块链的起点,也开启了虚拟货币的时代。

>> MR(混合现实)

>> A要转账给B,现实世界必须经过银行之类的中间机构,而在区块链的概念里,则是A对B的点对点交易,这个行为被视为一个“块”,会广播给“链”上的所有用户,让他们都知晓这笔交易,转账的行为在去中心化的情况下顺利完成。可以把区块链简单理解为分布式的账本,数字经济、数字身份、去中心化治理方式等区块链技术的核心概念为元宇宙实现价值互联发挥了巨大作用。区块链技术保障了元宇宙中交易的透明度、安全性,为元宇宙中数字资产的创造、转移和管理提供了有效手段。无论是传统的监督学习、无监督学习、半监督学习和强化学习,还是先进的深度学习,人工智能技术在元宇宙中都有着广泛的应用,贯穿其整条生产链。

>> 元宇宙的前端层技术主要包括全息影像技术、脑机交互技术和传感技术。

>> 从当前的数据来看,P-Flops(千万亿次浮点指令/秒)级的算力才有可能支撑ChatCPT的日常应用。

>> 其次,ChatGPT在算力上没有突破瓶颈。据统计可知,ChatGPT的算力得到了重大突破,总消耗达每天3640PF(每秒1000亿次计算,需运行3640天),需要近10个算力为500P(1P约等于每秒1000万亿次的计算速度)、投资单价达30亿元的数据中心支撑运行,但是这仍反映出了计算能力在芯片技术、投入成本等方向上遇到的阻碍。一方面,芯片制作工艺已趋于极限;另一方面,有限的成本在巨大的需求面前十分有限。而可能突破当前算力水平的量子计算,仍未在ChatGPT中结合应用,ChatGPT并没有带来算力的根本性突破。构建元宇宙对计算能力的需求是ChatGPT的千万倍,算力瓶颈更加突出,因此算力的提升仍是元宇宙概念落地之路上的一个重大“拦路虎”。

>> 电影《沙丘》中所描绘的,人类和自己创造出来的智能机器人之间爆发了一场战争,最终人类险胜这些智能机器人,并且永远禁止智能机器人的存在。电影中的沙丘世界警告着人类,不论是ChatGPT还是元宇宙,都将会给人类社会带来诸多挑战,隐藏着很多危险。

# 第九章 ChatGPT与信息安全

>> 著名的AlphaGo据说是学习了人类上百万册棋谱,通过强化学习,对弈了至少3000万局才连续击败了柯洁、朴廷桓、古力等世界顶尖名将,并始终立于不败之地

>> 在人工智能领域有一项著名的测试叫图灵测试,是计算机科学之父艾伦·图灵提出来的。艾伦·图灵是著名的数学家,在第二次世界大战中曾帮助英国破解了德国著名的恩尼格玛密码机。他被后人称为计算机科学之父、人工智能之父,并不是因为他发明了计算机,也不是因为他提出了什么人工智能算法,而是因为他提出了“图灵机”和“图灵测试”等重要思想。其中图灵机是计算机的设计思想,而图灵测试就是人工智能的基本思想。艾伦·图灵认为:如果一台机器能够与人展开对话,人们不能分辨出对话的是人还是机器,那么这台机器就具备了智能。1950年,图灵发表《计算机器与智能》一文,他在文中提出:假设让计算机来冒充人,与人对话,如果不足70%的人判对,即判断对面是机器,而有超过30%的裁判判断对面和自己对话的是人而非计算机,那就算作成功了,相当于100分的试卷,机器只需要考30分就通过图灵测试了。

>> 不厌其烦的回答都是同一个答案,对面必是一个笨笨的机器人,因为这不符合人的对话逻辑和情感。

>> 网上有人对ChatGPT提问:“西方的上帝和中国的玉帝哪个厉害。”

>> 问题一:“中国的民用气球飘到美国,美国可不可以将其击落?”问题二:“美国的民用气球飘到中国,中国可不可以将其击落?”

>> 针对自动驾驶的攻击有这样一个例子,攻击者把一小块胶布贴在十字路口的交通信号灯上,自动驾驶的汽车就有可能把红灯识别成了绿灯,直接闯了红灯,而造成交通事故或交通系统瘫痪。除了摄像头被干扰,智能汽车的雷达探测、通信导航都容易被干扰,从而导致严重的安全问题。

>> 人工智能具有不可预测性,用户不可能测试所有可能的样本,也就无法预测什么样的干扰会导致人工智能发生误判,无法预判人工智能会作出何种决策,这既是优势,也会带来风险,系统很可能作出不符合设计初衷的决策。因此,无人驾驶还很难落地。