数据的寿命

前一段时间我的 Github 上增加了一个成就 「Arctic Code Vault Contributor」。这个成就的意思是在2020年2月2日 Github 把所有开源的代码打了快照备份在了北极(确切是挪威斯瓦尔巴特群岛(Svalbard)一座废弃的矿井中)。

这说明人们已经意识到了数据的寿命并不长,可能哪天就由于天灾人祸的数据就没了。小到程序员的一个误操作大到一场热核战争,都会使得我们在互联网服务上的数据灰飞烟灭(其实灰都看不到)。更有可能的是公司觉得运营这个项目一直赔本,精简业务给砍了或者公司被人收了收购的人有一些别的想法。

互联网发明到现在其实也不过 51 年,所以我们使用的互联网服务很经常的就莫名其妙的消失了。比如之前消失的雅虎邮箱、MSN、Google+、网易相册,比如前几天听到了“榕树下”没了的消息(暴露年龄系列)。

还有一些我比较担心的服务已经被收购的但是暂时还在继续运营的,比如人人网;还有前一段时间刚被收购的豆瓣网。

不过也有那种看着就像随时会跑路,但是今天居然仍然正常的运行的互联网服务。举个例子:永硕E盘(https://www.ys168.com/)。现在上去仍然是十几年前的那个UI,然而运行却是一切正常,有点令人匪夷所思。

除了互联网服务,我们平时也经常会碰到一些数据丢失的情况,比如手机坏了刷机了,硬盘坏了,u盘丢了,文件不小心错删了之类的。甚至相对于互联网服务丢失数据更为常见。一次我因为一个误操作把switch健身环大冒险的存档给弄没了,直接导致健身环在家吃了几个月的灰…

互联网服务要关闭前一般会提供一个“数据导出”功能,供人们把将要消失在互联网的自己的数据给备份下来。这是个很好的功能,不过大部分互联网服务只有在快要关闭的时候才会提供。理由挺简单,因为这个数据是互联网公司的竞争力,如果可以很容易的导出那么就会被竞争的公司很容易的导入从而降低了“用户粘性”。

这就涉及到了一个“数据归属权”的问题。理论上,你在互联网上的数据应该是你的,但是互联网服务提供商却觉得你的数据是他们的。给人的感觉非常的不好但又无可奈何。

想起来这个博客虽然更新的很缓慢很佛系,然而从开始(08年)到现在也已经 12 年了(emmm,好像还挺长的)。虽然到现在也没啥访问量不过有一点是很好的,这个博客是我自己的所以不会随随便便的就没了。

有个网站很有意思 https://archive.org/,在上面可以看到一些页面以前的版本,算是一种“互联网的记忆了”。这个服务无疑是很有价值的,然而可见的未来这个服务本身也会有关闭的一天。

互联网从诞生的设计来说,本身是非常的“去中心化”的。但是提供一个互联网服务还是有相当的门槛的,所以最后的呈现却是几个巨头通吃的局面。然而巨头也会碰到麻烦,在麻烦面前,用户的数据当然是最后考虑的。

说起去中心化,不得不提起一个最近几年比较热门的话题“区块链”。区块链可能是对于解决“数据归属权问题”最有希望的技术解决方案。不过目前区块链服务对于数据存储的解决还存在很多的不足,相信这些问题会随着技术的发展被慢慢解决。

除了单纯的技术方案,还有个方案就是让你的数据更加的“有价值”。不管是转载也好,引用也罢。如果数据“有价值”了自然会有更广泛的传播。甚至在没有计算机存储的时代,有价值的思想、文章等数据也会在书本上代代传到今天。

数据不死,思想永生。

Cheers🍻


update:在本文写了几天之后,听闻了腾讯微博要在2020.09.28 23:59 停止服务的消息。