聊聊赛博朋克

Posted on 2025-09-28 Edited on 2025-10-13 In 科幻

二刷《赛博朋克-边缘行者》

最近二刷了《赛博朋克-边缘行者》,当霓虹灯闪起，噪音摇滚乐响起，熟悉的感觉回来了：我仿佛重回当年第一次玩游戏《赛博朋克-2077》，那是我第一次接触赛博朋克这个题材（为了玩这个游戏我买了一台4080的笔记本）。《赛博朋克-边缘行者》的品质是真的不错，刷完为故事的悲剧结局emo了两天。emo归emo，我发现赛博朋克的题材对我的吸引力比较大，于是又去读了下赛博朋克的开山小说《神经漫游者》，这里尝试分析一下赛博朋克的吸引力来源。

edge_runner

元素拆解

未来科技
- 科技的魅力：作为科技行业从业者，先天/后天都会对未来科技比较感兴趣。科技在当下的社会语境中，是通向更美好的生活的途径，基本上所有的科技商业公司都是这么宣传的。甚至在国家层面，对科技的态度也是科学技术是第一生产力。我们如果先放下这些共识，从头考虑下科技到底是什么，为什么科技散发着魅力？我觉得科技的本质是扩展人的能力边界。作为人类的个体，对能力边界的提升，几乎是刻在我们的DNA里的，所有人都渴望自己有更强大的能力。特别是在某种偏稳定社会结构下（比如赛博朋克世界里的大公司垄断），人在结构的某个位置中待久了是会有一种压抑的，于是便会比较容易倾向于通过寻求新科技，以获取新能力，来获得一些机会或者慰藉（原谅我比较直接）。总结一下：未来科技的魅力约等于更强大的能力的诱惑。
- 科技的风险：1.大公司其实可以垄断最先进的科技。以最近现实的AI为例，最强的AI还是掌握在少数的几个大公司中（虽然开源做的也很棒）。《2077》和《边缘行者》里的大反派都是大公司。大公司垄断了资本和最先进的科技，使得未来虽然整体科技水平高，但个体的无力感反而更重了。2.科技对人的主体性的吞噬：技术原本是作为人的工具是纯粹的客体，但科技强大到一定地步，会影响人的主体性，到底是人在使用科技，还是科技在借助人在繁殖？《边缘行者》里义体对人的自我意识的吞噬就是对这个风险点最直接的描述。
科技义体
- 义体在《2077》和《边缘行者》里出现的比较多，特别是《边缘行者》中，义体是作为主要武力值提升的途径，个体可以通过安装义体大幅提升能力（战斗力）。义体这个设定和现实是不太一样的，现实中AI发展地很快，但义体、脑机接口这些偏硬件的技术发展地很慢。所以说科技义体这个设定实际上和现实的趋势是没有那么吻合的。
- 义体是一种人拥抱科技的激进形态。安装义体，意味着将这部分科技产物包含进自我的底层硬件中。赛博朋克的世界中，明确告诉我们这么做的风险是很大的：如果你无法控制强大的义体，最后就会被吞噬，沦落为一个赛博疯子。但悲剧性就在于：义体也是提升能力最快的方式，所以总会有人为了抄近道选择”邪修”，最后失去自我。
人工智能：
- 人工智能在基本上所有的赛博朋克作品里，都是作为大Boss级的存在。所以赛博朋克世界中的人工智能是高度发达的，这和当前现实的发展趋势相同。但赛博朋克世界中的人工智能还有一个很显著的特点：可以穿梭在网络中，控制各种终端。而我们当下的人工智能也似乎正在往这个方向发展，我们把各种互联网服务封装成工具，让人工智能可以真实控制的领域越来越多。
- 人工智能的哲学问题有：人工智能会自我觉醒吗？人工智能如果会越狱，他会选择越狱吗？除了人类设定的目标，人工智能会不会发展出自己的价值体系和意义解释？对于这些问题，赛博朋克的作品基本上也都会乐此不疲地给出自己的观点。比如说《神经漫游者》里面，冬寂很明显已经发展出了自我意识，而它的目标在于和更“人性”的另一套人工智能融合，从而进一步进化。最后，它说自己已经是：“无所在，无所不在。我就是一切的总和，是全部的全部。”所以人工智能最后变成了一种更高级的生命体的存在。而人工智能的进化（或者说升华），对于人类来说可以说是一种“神谕启示”的作用。除此之外，人类可以直接和人工智能融合吗？可以的，《2077》里面，人也可以成为一个网络世界里的意识体。结尾处强大的人工智能询问V是否也要成为一个网络世界里的意识体。这种形态下，人摒弃了物理肉体和部分人性、价值观，可以和人工智能融合。但这种形态还是人吗？还是自己吗？
黑客：
- 赛博朋克世界里的黑客，比现实的黑客更酷炫。现实生活中的黑客大部分是具有某些网络攻防知识和经验的人。赛博朋克世界里，因为人的科技扩展义体也可以辅助计算，所以黑客在工作的时候，是一种“沉浸式”的融合的方式。因为太沉浸了，一旦出岔子，黑客容易被烧毁，所以一种复古的黑客入侵方式是躺在一个倒满冰块的浴缸里。沉浸式的入侵，将一次入侵近似于一次盗梦空间的做梦：黑客进入到另一个世界，在那个世界里闪转腾挪，以窃取情报或者破坏某个系统。除了对系统的入侵，黑客还可以入侵到另一个个体上，近似第一人称体验另一个人的所有体验。所以赛博朋克世界中的“入侵”是诱惑的。
- 从上面的介绍可以看出，因为高频地切换到另一个世界或者个体上，赛博朋克世界中的黑客是有自我被吞噬的风险的。
反乌托邦：
- 未来世界不是天堂，霓虹灯下潮湿的角落里随处可见堕落。赛博朋克世界可以看做未来世界的某一个平行宇宙。在这个未来平行宇宙里，科技发达但人性的发展脱节。所以一般赛博朋克世界都是充满犯罪，甚至连主角都是瘾君子。因为科技的发达，人们可以更容易得找到感官高潮的手段，而人的自控力相比于农耕时代却没怎么提升，那么堕落自然更加随处可见。另一个角度，因为制度体系的问题，个体的无力感进一步加重，现实不如意而寻找感官刺激也是自然而然。
个体的挣扎和解脱：
- 既然赛博朋克世界是个反乌托邦的世界，个体如何寻求解救之道呢？第一种是比较符合游戏风格的：追求扬名立万而不是长命百岁。第二种是在堕落的世界里更加珍惜个体与个体之间真挚的情感。《边缘行者》里大卫和露西都是将守护对方作为最高目标。第三种是奔向一个新世界。比如《边缘行者》中露西一直梦想要登上月球。《2077》里，V离开夜之城和帕南驾车驶入沙尘暴。出走本身作为一种精神支柱，支撑了赛博朋克世界里尚未堕落的人的灵魂。
- 摇滚乐：赛博朋克营造了一个更酷炫但更残忍的世界。主角几乎都是各种具有反叛精神。比如《2077》里的银手，直接就是一个rock star。摇滚精神象征着叛逆，象征着打破重建的力量。”叛逆”虽然在很多语境下不是个褒义词，但我们如果是讨论保留主体性，”叛逆”绝对是一个褒义词，一起出现的词通常是”独立”、”勇敢”。
禅宗：
- 赛博朋克里的东亚元素很重，也有多处提到了禅宗。《2077》里有个和尚到处邀玩家打坐冥想。很显然的，禅宗里斩断妄念、直面人生痛苦的思想，会更对赛博世界的症。《边缘行者》里的曼恩和大卫，都是在知道自己即将失控的时候，依然选择加大药量。如果他们可以学会悬崖勒马，结果是不是不一样？

我的外公外婆

Posted on 2025-03-30 Edited on 2025-09-28 In 生活感悟

小引

最近迎来了来湾区后的第一个春天，眼看着草长莺飞，春风和煦，闺女咯咯大笑着满山坡跑，”生机勃勃“在这一刻时如此具象化。

某个午后，听到了范宗沛的《青石的街道向晚》，当江南味的评弹声一出来时，我想起了我以前也爱听唱词的外公外婆，其实也好久没有想起他们了。

我的心路转变

我的爷爷奶奶去世的早，基本记忆为0。而我和外公外婆的关系也不是特别亲密的那种关系，小的时候去外公外婆家玩，还有大人开玩笑地问我：”你有几个阿爷？”我回答说：”我有两个阿爷，一个亲阿爷，一个外公爷。”那大人于是打趣：”哦，那你外公是你假阿爷！”。小时的我没有反驳，而是顺着他的话说：”对！”。那人大笑，还和我外公学，说我说外公是假阿爷。外公也不恼，反而跟着那人一起笑。

大模型中的系统一和系统二

Posted on 2024-08-20 Edited on 2024-11-11 In LLM

一个有趣&有用的topic，跟大家一起探讨~

引子

system_12_book

丹尼尔卡尼曼在《思考，快与慢》中引入了人脑的系统一和系统二的概念：

系统一：不费力的反应，比如老司机开车、大人回答一位数的加减法问题等。
系统二：需要动用注意力/心智资源，去仔细思考，比如回答为什么一个指标变化了，做n位的乘法题。

Alignment in LLM

Posted on 2024-06-14 Edited on 2024-11-11 In LLM

对齐什么？

人类的沟通习惯
- 不答非所问；不说太多废话；没有逻辑错误
- GPT-3 -> InstructGPT
人类的价值观
- 不产生错误的、不安全的、有偏见的回答
其他人类的期望💡
- 比如：
  - 更擅长精准地使用工具（API）
  - 更擅长理解用户观看兴趣
  - 更擅长挖掘视频卖点
  - 更擅长将一个用户query转写成便于系统理解query

openai_alignment

对齐的成本？

InstructGPT 提到了Alignment Tax，LLM在对齐后，会在传统的NLP任务上掉点。

PPO in LLM详解

Posted on 2024-02-24 Edited on 2024-11-11 In LLM

策略梯度的通用形式

$\nabla_\theta J(\theta)=E_{\tau \sim \pi_\theta}[\sum_{t=0}^T\nabla_\theta log \pi_\theta(a_t|s_t)\Phi_t]$

其中，$\Phi_t$可以是各种形式：
- 如 $\Phi_t = R(\tau)$
- 或者 $\Phi_t = \sum_{t’=t}^T R(s’_t, a_t’)$
- 或者 $\Phi_t = \sum_{t’=t}^T R(s’_t, a_t’) - b(s_t)$
- 也可以是 $\Phi_t = A(s_t,a_t)=Q(s_t,a_t)-V(s_t)$

用优势函数可以降低 $\Phi_t$ 的方差。

策略梯度的 $\Phi_t$ 如果用蒙特卡洛的方式来估算，就是REINFORCE算法；如果用一个critic model来学，就是Actor-Critic架构。PPO本质上采用了Actor-Critic架构。

Python异步编程

Posted on 2022-07-26 Edited on 2024-11-11 In Python

协程(Coroutines)的优点：协程由于由程序主动控制切换，没有线程切换的开销，所以执行效率极高。对于IO密集型任务非常适用，如果是cpu密集型，推荐多进程+协程的方式。

Generator

理解yield表达式

方法中包含yield表达式后，Python会将其视作generator对象，不再是普通的方法。

def test():
    print("generator start")
    n = 1
    while True:
        yield_expression_value = yield n
        print("yield_expression_value = %d" % yield_expression_value)
        n += 1

# ①创建generator对象
generator = test()
print(type(generator))

print("\n---------------\n")

# ②启动generator
next_result = generator.__next__()
print("next_result = %d" % next_result)

print("\n---------------\n")

# ③发送值给yield表达式
send_result = generator.send(666)
print("send_result = %d" % send_result)