Javen Chen's Blog

Tech and Life~

二刷《赛博朋克-边缘行者》

最近二刷了《赛博朋克-边缘行者》,当霓虹灯闪起,噪音摇滚乐响起,熟悉的感觉回来了:我仿佛重回当年第一次玩游戏《赛博朋克-2077》,那是我第一次接触赛博朋克这个题材(为了玩这个游戏我买了一台4080的笔记本)。《赛博朋克-边缘行者》的品质是真的不错,刷完为故事的悲剧结局emo了两天。emo归emo,我发现赛博朋克的题材对我的吸引力比较大,于是又去读了下赛博朋克的开山小说《神经漫游者》,这里尝试分析一下赛博朋克的吸引力来源

edge_runner

元素拆解

  • 未来科技
    • 科技的魅力:作为科技行业从业者,先天/后天都会对未来科技比较感兴趣。科技在当下的社会语境中,是通向更美好的生活的途径,基本上所有的科技商业公司都是这么宣传的。甚至在国家层面,对科技的态度也是科学技术是第一生产力。我们如果先放下这些共识,从头考虑下科技到底是什么,为什么科技散发着魅力?我觉得科技的本质是扩展人的能力边界。作为人类的个体,对能力边界的提升,几乎是刻在我们的DNA里的,所有人都渴望自己有更强大的能力。特别是在某种偏稳定社会结构下(比如赛博朋克世界里的大公司垄断),人在结构的某个位置中待久了是会有一种压抑的,于是便会比较容易倾向于通过寻求新科技,以获取新能力,来获得一些机会或者慰藉(原谅我比较直接)。总结一下:未来科技的魅力约等于更强大的能力的诱惑
    • 科技的风险:1.大公司其实可以垄断最先进的科技。以最近现实的AI为例,最强的AI还是掌握在少数的几个大公司中(虽然开源做的也很棒)。《2077》和《边缘行者》里的大反派都是大公司。大公司垄断了资本和最先进的科技,使得未来虽然整体科技水平高,但个体的无力感反而更重了。2.科技对人的主体性的吞噬:技术原本是作为人的工具是纯粹的客体,但科技强大到一定地步,会影响人的主体性,到底是人在使用科技,还是科技在借助人在繁殖?《边缘行者》里义体对人的自我意识的吞噬就是对这个风险点最直接的描述。
  • 科技义体
    • 义体在《2077》和《边缘行者》里出现的比较多,特别是《边缘行者》中,义体是作为主要武力值提升的途径,个体可以通过安装义体大幅提升能力(战斗力)。义体这个设定和现实是不太一样的,现实中AI发展地很快,但义体、脑机接口这些偏硬件的技术发展地很慢。所以说科技义体这个设定实际上和现实的趋势是没有那么吻合的。
    • 义体是一种人拥抱科技的激进形态。安装义体,意味着将这部分科技产物包含进自我的底层硬件中。赛博朋克的世界中,明确告诉我们这么做的风险是很大的:如果你无法控制强大的义体,最后就会被吞噬,沦落为一个赛博疯子。但悲剧性就在于:义体也是提升能力最快的方式,所以总会有人为了抄近道选择”邪修”,最后失去自我。
  • 人工智能
    • 人工智能在基本上所有的赛博朋克作品里,都是作为大Boss级的存在。所以赛博朋克世界中的人工智能是高度发达的,这和当前现实的发展趋势相同。但赛博朋克世界中的人工智能还有一个很显著的特点:可以穿梭在网络中,控制各种终端。而我们当下的人工智能也似乎正在往这个方向发展,我们把各种互联网服务封装成工具,让人工智能可以真实控制的领域越来越多。
    • 人工智能的哲学问题有:人工智能会自我觉醒吗?人工智能如果会越狱,他会选择越狱吗?除了人类设定的目标,人工智能会不会发展出自己的价值体系和意义解释?对于这些问题,赛博朋克的作品基本上也都会乐此不疲地给出自己的观点。比如说《神经漫游者》里面,冬寂很明显已经发展出了自我意识,而它的目标在于和更“人性”的另一套人工智能融合,从而进一步进化。最后,它说自己已经是:“无所在,无所不在。我就是一切的总和,是全部的全部。”所以人工智能最后变成了一种更高级的生命体的存在。而人工智能的进化(或者说升华),对于人类来说可以说是一种“神谕启示”的作用。除此之外,人类可以直接和人工智能融合吗?可以的,《2077》里面,人也可以成为一个网络世界里的意识体。结尾处强大的人工智能询问V是否也要成为一个网络世界里的意识体。这种形态下,人摒弃了物理肉体和部分人性、价值观,可以和人工智能融合。但这种形态还是人吗?还是自己吗?
  • 黑客
    • 赛博朋克世界里的黑客,比现实的黑客更酷炫。现实生活中的黑客大部分是具有某些网络攻防知识和经验的人。赛博朋克世界里,因为人的科技扩展义体也可以辅助计算,所以黑客在工作的时候,是一种“沉浸式”的融合的方式。因为太沉浸了,一旦出岔子,黑客容易被烧毁,所以一种复古的黑客入侵方式是躺在一个倒满冰块的浴缸里。沉浸式的入侵,将一次入侵近似于一次盗梦空间的做梦:黑客进入到另一个世界,在那个世界里闪转腾挪,以窃取情报或者破坏某个系统。除了对系统的入侵,黑客还可以入侵到另一个个体上,近似第一人称体验另一个人的所有体验。所以赛博朋克世界中的“入侵”是诱惑的
    • 从上面的介绍可以看出,因为高频地切换到另一个世界或者个体上,赛博朋克世界中的黑客是有自我被吞噬的风险的。
  • 反乌托邦
    • 未来世界不是天堂,霓虹灯下潮湿的角落里随处可见堕落。赛博朋克世界可以看做未来世界的某一个平行宇宙。在这个未来平行宇宙里,科技发达但人性的发展脱节。所以一般赛博朋克世界都是充满犯罪,甚至连主角都是瘾君子。因为科技的发达,人们可以更容易得找到感官高潮的手段,而人的自控力相比于农耕时代却没怎么提升,那么堕落自然更加随处可见。另一个角度,因为制度体系的问题,个体的无力感进一步加重,现实不如意而寻找感官刺激也是自然而然。
  • 个体的挣扎和解脱
    • 既然赛博朋克世界是个反乌托邦的世界,个体如何寻求解救之道呢?第一种是比较符合游戏风格的:追求扬名立万而不是长命百岁。第二种是在堕落的世界里更加珍惜个体与个体之间真挚的情感。《边缘行者》里大卫和露西都是将守护对方作为最高目标。第三种是奔向一个新世界。比如《边缘行者》中露西一直梦想要登上月球。《2077》里,V离开夜之城和帕南驾车驶入沙尘暴。出走本身作为一种精神支柱,支撑了赛博朋克世界里尚未堕落的人的灵魂
    • 摇滚乐:赛博朋克营造了一个更酷炫但更残忍的世界。主角几乎都是各种具有反叛精神。比如《2077》里的银手,直接就是一个rock star。摇滚精神象征着叛逆,象征着打破重建的力量。”叛逆”虽然在很多语境下不是个褒义词,但我们如果是讨论保留主体性,”叛逆”绝对是一个褒义词,一起出现的词通常是”独立”、”勇敢”。
  • 禅宗
    • 赛博朋克里的东亚元素很重,也有多处提到了禅宗。《2077》里有个和尚到处邀玩家打坐冥想。很显然的,禅宗里斩断妄念、直面人生痛苦的思想,会更对赛博世界的症。《边缘行者》里的曼恩和大卫,都是在知道自己即将失控的时候,依然选择加大药量。如果他们可以学会悬崖勒马,结果是不是不一样?
Read more »

小引

最近迎来了来湾区后的第一个春天,眼看着草长莺飞,春风和煦,闺女咯咯大笑着满山坡跑,”生机勃勃“在这一刻时如此具象化。

某个午后,听到了范宗沛的《青石的街道向晚》,当江南味的评弹声一出来时,我想起了我以前也爱听唱词的外公外婆,其实也好久没有想起他们了。

我的心路转变

我的爷爷奶奶去世的早,基本记忆为0。而我和外公外婆的关系也不是特别亲密的那种关系,小的时候去外公外婆家玩,还有大人开玩笑地问我:”你有几个阿爷?”我回答说:”我有两个阿爷,一个亲阿爷,一个外公爷。”那大人于是打趣:”哦,那你外公是你假阿爷!”。小时的我没有反驳,而是顺着他的话说:”对!”。那人大笑,还和我外公学,说我说外公是假阿爷。外公也不恼,反而跟着那人一起笑。

Read more »

一个有趣&有用的topic,跟大家一起探讨~

引子

system_12_book

丹尼尔卡尼曼在《思考,快与慢》中引入了人脑的系统一和系统二的概念:

  • 系统一:不费力的反应,比如老司机开车、大人回答一位数的加减法问题等。
  • 系统二:需要动用注意力/心智资源,去仔细思考,比如回答为什么一个指标变化了,做n位的乘法题。
Read more »

对齐什么?

  • 人类的沟通习惯
    • 不答非所问;不说太多废话;没有逻辑错误
    • GPT-3 -> InstructGPT
  • 人类的价值观
    • 不产生错误的、不安全的、有偏见的回答
  • 其他人类的期望💡
    • 比如:
      • 更擅长精准地使用工具(API)
      • 更擅长理解用户观看兴趣
      • 更擅长挖掘视频卖点
      • 更擅长将一个用户query转写成便于系统理解query

openai_alignment

对齐的成本?

InstructGPT 提到了Alignment Tax,LLM在对齐后,会在传统的NLP任务上掉点。

Read more »

策略梯度的通用形式

$\nabla_\theta J(\theta)=E_{\tau \sim \pi_\theta}[\sum_{t=0}^T\nabla_\theta log \pi_\theta(a_t|s_t)\Phi_t]$

  • 其中,$\Phi_t$可以是各种形式:
    • 如 $\Phi_t = R(\tau)$
    • 或者 $\Phi_t = \sum_{t’=t}^T R(s’_t, a_t’)$
    • 或者 $\Phi_t = \sum_{t’=t}^T R(s’_t, a_t’) - b(s_t)$
    • 也可以是 $\Phi_t = A(s_t,a_t)=Q(s_t,a_t)-V(s_t)$

用优势函数可以降低 $\Phi_t$ 的方差。

策略梯度的 $\Phi_t$ 如果用蒙特卡洛的方式来估算,就是REINFORCE算法;如果用一个critic model来学,就是Actor-Critic架构。PPO本质上采用了Actor-Critic架构。

Read more »

协程(Coroutines)的优点:协程由于由程序主动控制切换,没有线程切换的开销,所以执行效率极高。对于IO密集型任务非常适用,如果是cpu密集型,推荐多进程+协程的方式。

Generator

理解yield表达式

方法中包含yield表达式后,Python会将其视作generator对象,不再是普通的方法。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
def test():
print("generator start")
n = 1
while True:
yield_expression_value = yield n
print("yield_expression_value = %d" % yield_expression_value)
n += 1

# ①创建generator对象
generator = test()
print(type(generator))

print("\n---------------\n")

# ②启动generator
next_result = generator.__next__()
print("next_result = %d" % next_result)

print("\n---------------\n")

# ③发送值给yield表达式
send_result = generator.send(666)
print("send_result = %d" % send_result)
Read more »

小引

去年在工作中,研究了一段时间的图文预训练,对这块的发展脉络比较清楚,也在工作中尝试捣鼓了一些解决方案。这里记录梳理一下。本文的目标是梳理图文预训练整体的发展方向,着重分析为什么会这么发展,而不仅仅是论文解读的罗列。追溯的时间区间为2019年到2022年初。

什么是图文预训练?

先用一句话概括:图文预训练借鉴了文本预训练的范式,对图文输入进行预训练,并应用于下游图文交互任务。

现实的人工智能一定是多模态的,对人类来说,图文是两个很重要的模态,以至于在AI领域,CV和NLP也几乎是各占半壁江山。那问题就来了,我们能不能直接研究图文兼备的模型呢?CV和NLP的交叉领域的问题应该怎么解呢?这些问题,都催生出了图文预训练。

Read more »

小引

前几周得了流感,脑袋昏昏沉沉。原本每日早起健身也暂停了,早上起来去上班之前,便半倚在床头,看起了《禅者的初心》。一连十来天,隐约觉得感冒时读此书,特别有禅定的感觉:读的时候专注地读,心里也只有禅师教导的话语,没有二心。

等流感痊愈,近几日又去读书,感觉心中容易烦乱,于是停了下来,好好观察:是什么,导致了这种烦乱?

冲突和矛盾

我们的心,用佛教术语来说,容易心猿意马:一会儿对这个感兴趣,一会儿痛恨那个。而内心的冲突和矛盾,大概是你的心里,有两个矛盾的想法同时存在,而你陷入二者的纠结之中,难以抉择。

Read more »
0%