不知为什么突然想了解下《大英百科全书》,于是我来到了Wiki的大英百科全书页面。最后一部分 阅读者 中写道:

世间不乏把《大英百科全书》完整读完的人,例如,卡扎尔王朝君王法阿里曾读完第三版,美国商人Amos Urban Shirk花了4年半,读完共23册的1911年版[20],除此之外还有爱尔兰剧作家萧伯纳、美国物理学家费曼、英国小说家科里士打(C. S. Forester)等[21]。2006年,一位任职《君子杂志》(Esquire)的记者A·J·贾各布斯花了一年多的时间,看完3万3千页的2002年版,并把读后感写成一本书《我的大英百科狂想曲》(The Know-It-All: One Man\'s Humble Quest to Become the Smartest Person in the World)。王云五在19岁时购得《大英百科全书》,以三年时间将全书35巨册阅览一遍。[22]胡适称王云五是“有脚的百科全书”。

我不禁醍醐灌顶,灵光乍现,既然我寻求点子,为什么不也来读一遍呢!简直相见恨晚啊,于是马上开始打算买书,在中亚敲上 大英百科全书 几个字。居然有中文,仔细一看 此商品仅剩 2 件 - 欲购从速 ,再仔细一看 ¥1,461.19。嗯,内心逐渐平静,还是再仔细看看之前的wiki条目吧....

仔细再看一遍Wiki的条目,上面还介绍了 《大美百科全书》(Encyclopedia Americana)、《世界图书百科全书》(World Book Encyclopedia)和《康普顿百科全书》(Compton\'s Encyclopedia)。估计也是这个价,继续看

历经了244年的漫长岁月,《大英百科全书》2012年3月13日宣布,目前市面上库存的纸本百科全书卖完后,将不再推出印刷版,内容全面数位化。为纪念印刷版本的“光荣退役”,《大英百科全书》网站自3月13日起提供一周的免费浏览。

数位化?!在线免费看?我又燃起了希望之火。一顿猛搜,找到了www.britannica.com。好像真的可以啊,不过画风和我想得有点不同,上面一个大大的搜索框,下面一堆类似随即条目的东西,我应该怎么看完他?在框里打上weininger,来到www.britannica.com/biography/Otto-Weininger页面:

Otto Weininger, (born April 3, 1880, Vienna—died Oct. 4, 1903, Vienna), Austrian philosopher whose single work, Geschlecht und Charakter (1903; Sex and Character), served as a sourcebook for anti-Semitic propagandists.

The son of a prosperous Jewish artisan, Weininger became a Christian the day he received his Ph.D. degree from the University of Vienna (1902). The following year he published his partly scientific, partly philosophical study in which he advanced the thesis that all living things combined varying proportions of masculine and feminine elements. The masculine element was positive, productive, and moral, while the feminine was negative, unproductive, and amoral. In the chapter “Über das Judentum,” he denounced Judaism as feminine and amoral in contrast to Christianity. Weininger shot himself at the age of 23, shortly after the publication of Geschlecht und Charakter.

就上面这几句话,还没Wikipedia详细呢!而且看了半天,似乎没什么目录之类的,难道要我写个蜘蛛把页面全抓了不成?不过这时,我又来了灵感,这东西不和Wikipedia一样么?与其看他不如把Wikipedia全看完,还有中文的呢。既然是在这个时代,这类信息还用的着看这些出版物么,人人可编辑自由百科全书 不把这完爆了?

于是乎马上开始着手,写个蜘蛛?应该怎么抓?又搜了一圈,找到了这个页面,包含了全部的条目,全部遍历一遍就OK了。打算开始写,不过,我有一些担心,Wikipedia会不会有响应限制?我又觉得Wikipedia一定有什么接口给用,而且有我这想法的不止我一个,何必在重复造轮子(懒)。于是又搜了一圈,又找到了这个这个页面何止接口,人家都给你打包好啦。赶快下载把!于是:

WTH,这辈子第一次遇上wikimedia.org出问题的....


第二天,恢复了,于是直接下载了,20190120的版本一共1.69GB,假设一个汉字2字节,则大约有845,000,000个字,看来这确实是得以年为计的活动,我想先放低下难度,找几个没那么庞大的wiki来看,我想到了两个:萌娘百科和伪基百科。因为内容不多所以打算直接看,届时会将有趣的页面摘录一些。

详见:维基百科读完计划 —— 本篇