Aaron 的故事

08 Nov 2017

Unjust laws exist; 世有不公之法;

shall we be content to obey them, 我们是要安于循守,

or shall we endeavor to amend them, and obey them until we have succeeded, 还是且改且守,待其功成,

or shall we transgress them at once? 或是即刻起而破之?

—— Henry David Thoreau

欢迎收听「骇客邦」播客节目,今天是 2017 年 11 月 8 日,我们的首期节目要来聊一聊 Aaron Swartz

Aaron Swartz 是谁?

先来说一下 Aaron Swartz 是谁,说几个跟他相关的作品:

这些东西我相信很多计算机从业者都听说过,至少在今天看来这些作品都是很有意义的,应该说 Aaron 为互联网世界贡献了很多美好的东西,但是很不幸的是,在 2013 年 1 月 11 日,Aaron 自杀了,那一年他 26 岁。

1986 年 11 月 8 日,Aaron Swartz 出生于美国芝加哥伊利诺伊州,他父亲创办了一个软件公司,Aaron 在 3 岁的时候就接触到了计算机,然后产生了浓厚的兴趣。要知道那个时候的计算机并不像今天这么先进,真正的互联网大面积推广和普及起来应该起码得从 1994 年网景推出的浏览器开始算起,但是 Aaron 从小就已经对计算机产生了兴趣,而且在十几岁时,就已经取得了成绩(这个我们后面会详细来说),所以天才真的是小的时候就跟普通孩子是不一样的,比如说,据说比尔盖茨在很小的时候就对数学产生了浓厚的兴趣,之后在读高中的时候接触到了计算机,开始着迷于使用计算机解决数学问题和计算机编程,之后就有了现在的微软公司;还有巴菲特小的时候据说对数字特别敏感,他能在街道边呆一下午,记录路上来来往往的汽车车牌号码,而且有超常的数字记忆能力,平时玩的游戏也跟普通孩子不一样,例如他的小伙伴说出一个城市名称,他能迅速地报出这个城市的人口数量……

天才少年

我们再通过 Aaron Swartz 青少年时期来看一下他是怎么样的一个天才:

RSS 这个东西我觉得实在太有用了。如果你还没有使用过呢,在这里我想罗嗦几句,向你简单介绍一下我们可以用它做什么。举个例子,我们肯定都见过它的,它在网站上呈现的标志通常是一个橘色背景,上面是白色的像彩虹一样左下角一个圆点,然后右上方两道弧线,中文网站可能会附上“订阅”两个字用以说明,英文网站大都就是 RSS 三个字母。

我们平时获取信息的方式我觉得可以分为两种:一种是主动获取,一种是被动接收推送。大多数人主要的信息获取方式都是被动接收推送的,包括我们在手机上使用的一些信息聚合类的应用,尽管我们是主动关注某几个分类然后得到的相关信息,但是这些应用的信息渠道通常是有限数量的网站,除非是那种可以自己添加信息渠道、自己添加网站的应用,如果是这样,那这个应用也不算是信息聚合类的应用了,应该就算是一个 RSS 客户端了,我觉得这算是一种被动接收信息的方式,也包括习惯天天刷朋友圈的行为。

所以通过 RSS 客户端我们是可以主动添加我们要关注的一些网站,然后这些网站有了更新时,我们就可以在 RSS 客户端第一时间收到提醒进行查阅,而不必一个一个地打开那些网站查看更新。

然后我们继续来说 Aaron 的经历:

RDF 是 Resource Description Framework 的缩写,中文译名为资源描述框架,是一门向互联网表达信息的语言框架,可以用来描述 web 资源,比如作者、标题以及可用时间、版本信息、内容描述表等等。由于使用的是结构化的 XML 数据,搜索引擎可以更好地理解这种元数据的含义,所以就会使搜索变得更智能和准确。简单来说,RDF 就是为了使信息能够被程序更友好地读取和理解。

创业阶段

在当时美国有一家做风险投资的公司叫做 Y Combinator,简称 YC,YC 的投资模式跟大多数的风险投资公司不太一样,首先他们的投资对象主要是初创公司,然后他们不止会向初创公司提供种子基金,而且会给一些创业建议,还有每年两次,每次三个月的课程。YC 的这种模式深受好评,创始人是 Paul Graham,也是我很佩服的一个人,有机会的话我们以后来聊一聊他,他写过一本书叫做《HACKERS AND PAINTERS》,中文译名是《黑客与画家》,感兴趣的朋友回头可以找来读一下。

根据维基百科的描述:Aaron 进入斯坦福大学后就申请了 YC 公司夏季的创始人项目,Aaron 当时的创业项目叫 Infogami,他设计了一个内容管理系统,在这个项目进行到 2005 年夏天的时候,Aaron 选择辍学,专心开发 Infogami 和为项目寻找资金。

关于 Infogami 后来的故事,维基百科的描述是这样:在开发 Infogami 的过程中,Aaron 因为不满意 Python 现有的框架,所以开发了 web.py 框架。并且在 2005 年秋季的时候,Aaron 加入了当时 YC 公司的另一个孵化项目 Reddit,关于 Reddit 这家公司我们在这里就不展开讲了,总之 Reddit 也是一个很有特点很火的网站,Aaron 和 Reddit 的创始人一起工作,他们一起用 Python 和 web.py 来重写 Reddit 的 Lisp 代码库。Infogami 因为融资困难,YC 公司建议 Infogami 和 Reddit 合并,于是在 2005 年的 11 月,合并后的新公司取名为 Not A Bug。

Not A Bug 被收购以后,Aaron 就去了这家出版社工作,但是他受不了办公室的那种工作环境,也受不了公司在他电脑上面安装的一些软件,他觉得是被安装了很多垃圾软件,而且公司不允许他自己安装新的软件,于是 Aaron 在 2007 年 1 月就离职了。

信息公有

离职之后的 Aaron 开始把精力投入到一系列关于信息公有的项目,例如,刚刚说到的 Aaron 的 Open Library(互联网开放图书馆)项目,作为图书馆总得有书籍,即便是在网络上的图书馆也需要海量的数据支持,Aaron 的数据从哪里来的呢?

在 2006 年,Aaron 下载了美国国会图书馆的书目数据并放到了自己的这个开放图书馆上,你说 Aaron 这么做触犯法律了吗?其实这里有这样一个问题:图书馆本来是要收费才允许访问这些数据,但由于这些数据属于政府文件,在美国这样的文件是不受版权保护的。而 Aaron 做这些却并不是为了将数据据为己有,也不是为了个人名利。因为所有的这些数据都捐赠给了 Internet Archive (互联网档案馆)机构,供所有人免费享用。

从这些经历我们也可以看到,Aaron 是一个崇尚资源合理共享,不喜欢受约束,喜欢开放的人,就是互联网主张的开放精神。他的开放图书馆是想把那些没有版权的书籍和学术期刊放在网上让全世界的人免费查阅。因为他觉得互联网应该成为连接书籍,读者,作者,纸张与思想的最好载体,我们会发现在他的青少年时期,他就在和限制信息自由交换和自由共享的做法做斗争,包括他所参与的 RSS 和 RDF 项目。

还有一个例子是这样的,美国法院行政办公室有一个叫 PACER(Public Access to Court Electronic Records)的政府服务。这个服务会把法庭记录的文件放在网上,如果你要看的话,一页需要付费 8 美分,根据纽约时报的报道,该收入主要为了法院的技术投入提供资金支持,但根据法院的报告来看 PACER 这个服务每年可以为政府带来 1.5 亿美金的盈利。这件事 Aaron 非常不能理解,他觉得这些文件本来就属于公众,是没有版权的,为什么属于公众的东西还要收费。

于是 Aaron 在 2008 年 9 月 4 日到 20 日,他 22 岁的时候,他用 Perl 在 AWS 上写了一个程序,从 PACER 上下载了据说近 2000 万页的文档。于是 FBI 对他调查了两个多月,那些下载的文档中揭露了法庭文件对个人隐私的大规模侵犯,他从文档中发现了法学研究的资助方和正面结果之间的令人忧心的联系。事件最后法庭改变了他们的政策,FBI 也结束了调查,没有对他提出指控。

2008 年的时候还有一件事是 Aaron 创建了一个网站 watchdog.net,专门收集和公布政治家的数据。关于这个网站最初的设想你可以到 Aaron 的博客上了解一下他的想法,相关链接我会放在「骇客邦」的这篇文章里。

同样在这一年,他还起草了 Guerrilla Open Access Manifesto[via],中文版的节选我在这里读一下:

信息就是能源。但就像所有能源一样,有些人只想占为己有。世界上所有的科学和文化遗产,已在书籍和期刊上发布了数个世纪,正渐渐地被少数私有的公司数字化并上锁。想要阅读那些有着最著名研究成果的论文?你必须支付给如 Reed Elsevier 这样的出版商大把钱。

……

我们要夺回信息,无论它们被存在何处,制作我们的副本并和全世界分享。我们要取到版权到期的东西并将它们归档,我们要买下秘密的资料库并将它们放到网上。我们要下载科学期刊并将它们上传到文件分享网络。我们要为开放访问而战。

只要全世界有足够多的我们,那就不仅是传达了一个反对知识私有化的强有力信号,我们还将让它成为过去。你愿意和我们一起吗?

—— 亚伦·斯沃茨 (Aaron Swartz) 2008 年 7 月,意大利 Eremo

政治活动

Aaron 很崇拜的一个人是 Tim Berners-Lee,Tim 被称为“互联网之父”,因为他在 1991 年 8 月 6 日发布了世界上第一个 web 网站(到今天这个网站依然可以访问),但是 Tim 并没有利用这个发明赚钱,而是无偿地把互联网的构想和设计推广给了全世界。Aaron 曾经在当众发表的演说中提到,当看到矿工们直到汗流浃背时才可能会放下铁锤,因为他们知道如果自己停下,今晚可能就吃不上饭了,而他自己每天只是坐在那里看电视就可以赚着越来越多的钱。他觉得这是很离谱的、很荒谬的一个世界。

受扰于这种信息封锁和贫富差距的事实,Aaron 开始从技术领域转入了更广阔的政治领域。

PCCC 尝试组织起互联网上的人,把那些关心进步政治、推动国家变得更进步的人聚到一起,帮助全国各地的进步议员当选。

JSTOR 事件

JSTOR 是一个 academic databases,一个学术数据库,其使命是“让全世界的人都能访问学术成果,并把学术成果代代不息地传承下去”。具体做法是把各个学校的的学术期刊收集起来,统一数字化,让人们可以下载、搜索;但它不是一家出版商,所以不必向作者付费,只依靠作者的意愿来做数字化的工作。它是一家非营利组织,主要向学校销售订阅账号,以此来支撑其运营成本。

Aaron 和 JSTOR 的事件主要经过是这样:

事后,JSTOR 发表声明表示,起诉 Aaron 的是政府行为,作为一个非营利目的的学术数据库,JSTOR 无意介入法律事件。

2011 年 7 月 19 日,由 Aaron 创立的 Demand Progress 发布了一篇新闻稿,表示支持 Aaron 的行为。

案件到了这里,本该了结了,但政府并没有放手,在《互联网之子》纪录片中,Aaron 的父亲说,当时负责案件的检察官 Steve Heymann 表示,他们要用这次案件起到一种威慑作用。

根据麻省理工的解释说,检察官 Steve Heymann 回应了 Demand Progress 的那份简短的支持声明,说那是“野蛮的网络活动”和“愚蠢的行为”。

随后,麻省理工方面也发表了保持中立的声明,这样的态度即便在麻省理工的人看来也是简直离谱的,因为麻省理工算是全世界最鼓励倡导黑客活动的地方了,学校里会有一些不允许进入的房顶和隧道,那些标志对学生来说根本没有作用,麻省理工在冬季甚至还有开锁的课程,他们本该有着道义权威来阻止起诉继续的,但是他们保持了中立,而我们也知道,在政府与个体对立时,麻省理工的中立到底意味着什么。

Aaron 则继续进行着他的政治活动……

SOPA 事件

2011 年 10 月,政府提出 SOPA(Stop Online Piracy Act)法案(禁止网络盗版法案),而在当时 SOPA 的意图只是遏制网络上的音乐和影视盗版,但通过发布一部新的法案来解决这样一个问题,让很多人怀疑政府的真实意图。因为如果法案通过了,意味着政府只需要一份侵权声明就可以介入甚至关闭一家互联网公司。一些活动家认为,这样的法案是一种巨大的越权,它会威胁到互联网自身的技术性完整。

Aaron 通过他的 Demand Progress 把民众聚集起来,和政府做斗争,最终导致了整个社会都在反对 SOPA,包括那些议员也纷纷改变了自己的想法,最后白宫于 2012 年 1 月 16 日发表声明表示不支持这项法案。应该说这是一次民主的胜利,与 Aaron 有密切的关系。

在这里我想引用哈佛大学教授 Lawrence Lessig 也是 CC 知识共享协议的创始人的一段话:

作为一个从未觉得自己做了多大贡献的人,作为 Aaron 来说,这是为数不多的时刻之一,你能真正看到,他觉得自己是做了些好事的,觉得这是他的一次且唯一一次胜利。

—— Lawrence Lessig

2012 年 9 月 12 日,联邦检查办公室向 Aaron 增加了 9 项重罪指控,这让 Aaron 可能的刑罚达到了 50 年监禁和 100 万美元罚金,起诉方指控 Aaron 的法律依据是一部 1986 年的《计算机欺诈与滥用法案》(Computer Fraud and Abuse Act)。

这里补充一下,政府在和 Aaron 的律师的辩诉谈判过程中,Aaron 是有选择的,就是他可以选择承认一共的 13 项罪名,然后入狱半年。Aaron 和他的律师拒绝接受这样的条件。

2013 年 1 月 11 日,Aaron 自杀了。

Aaron is dead. 亚伦死了。

Wanderers in this crazy world, 在这个疯狂世界漫游的人们,

we have lost a mentor, a wise elder. 我们失去了一位导师,一位智者。

Hackers for right, 匡扶正义的黑客们,

we are one down, 我们倒下了一员,

we have lost one of our own. 我们失去了我们中的一员。

Nurtures, 教育者们,

careers, 职业者们,

listeners, 聆听者们,

feeders, 供给者们,

parents all, 所有的父母们,

we have lost a child. 我们失去了一个孩子。

Let us all weep. 让我们哭泣吧。

—— Sir Tim Berners-Lee, January 11, 2013

他是互联网之子,他用生命捍卫了互联网的开放和自由。

是谁杀害了他?


欢迎通过 iTunes 或者泛用型客户端订阅我们的播客和加入「骇客邦」群组

泛用型播客客户端订阅地址

苹果 iTunes 播客收听地址

「骇客邦」海外电报群组

「骇客邦」国内知识星球


相关链接

Aaron Swartz
Tim Berners-Lee
Aaron Swartz - Wikipedia
Internet Archive
Wayback Machine
Infogami Developer Tutorial | Open Library
Open Library Team @Github

全文的资料收集、整理、编排、书写和录音历时三周,期间我查阅了大量关于 Aaron 的中文资料,直到发现后来的大部分文章均为雷同,并在结合英文资料对比参考时发现了很多不一致的地方,所以我之后便放弃了中文文本资料的搜索。本文以英文维基百科和《互联网之子》记录片为主要线索,企业及媒体文章补充辅助来尽力为大家呈现一个真实的 Aaron Swarts。但历史是无法绝对还原的,请谅解。

更新历史

2017/11/08:初稿 于东京

加入「骇客邦」并参与本文讨论