Internet Archive(archive.org)成立于1996年,由Alexa创始人布鲁斯特·卡利(Brewster Kahle)创办,是一个Wayback machine公益性质的计划。Internet Archive非正式中文名有“网站时光倒流机器”、“互联网档案馆”等,Internet Archive定期收录永久保存全球网站可抓取信息,大网站比如google会每天备份一次,每次收录入十个左右网页,一些小网站每年只收录几次。用户可以通过Internet Archive的“Take Me Back”对网站的发展与历史资料进行研究。目前,“互联网档案计划”分为六大部分,截至本文发布Internet Archive已拥有馆藏免费电子图书539539 本、音频资料300743个、音乐资源53846个和视频资源136964部、注册用户60余万,而且还在不断增加中。分别简要介绍如下:
[以下内容引自阮一峰的网络日志]:
一、电子书
网址:http://www.archive.org/details/texts
专门收集公共领域的书籍和文档,任何人都可以免费下载。它主要收集英语书籍,但也包括少部分其他语种的书籍,比如朱熹的《论语集注》。
二、网页
网址:http://www.archive.org/web/web.php
这个部分有个专门的名字,叫做”时光倒流机器“(Wayback Machine),它像收集旧报纸那样收集旧网页。举例来说,Yahoo!的首页就有5000多份档案,最早的可以回溯到1996年10月17日。要将全世界的网页都保存下来,这需要多大的存储容量啊?根据2006年的统计,当时Wayback Machine的存储容量有2000T,然后还在以每月20T的速度增加。
三、视频
网址:http://www.archive.org/details/movies
这个部分收集视频材料,你在其中可以找到动画片和电影。我感觉内容还不算很丰富,不过在其中经常可以找到有趣的内容,比如《如果抵御僵尸的袭击?》和1951年的好莱坞喜剧片《皇家婚礼》。
四、音频
网址:http://www.archive.org/details/audio
音频材料主要是有声书籍和音乐。比如,你可以免费下载世界名著《简爱》的MP3,以及巴赫的《 C小調第4奏鸣曲》等等。
五、软件
网址:http://www.archive.org/details/software
软件也是人类文化的一部分,保存旧软件同保存旧书一样,都是很有意义的。我在上面发现了Photoshop 6.0的DEMO版和Winamp 5.0。
六、教育材料
网址:http://www.archive.org/details/arsdigita
这部分主要是美国大学课程,有视频和文字材料下载,相当于不去北美就可以上那里的课,比如麻省理工学院的《微分方程》和Naropa大学的《艾伦·金斯堡的诗歌》。