哥德尔给出了数学的极限:在数学的领地上,有些东西我们不知道,也不可能知道 。
尴尬的是,这就给数学家们心头压上了一块大石:谁也不知道自己辛辛苦苦做了十几年的题目,会不会突然有一天被证明是在现有数学体系中不可判定的 。
测量的边界:任何测量都有必然误差现实世界的对象其实无穷维度的,而测量的本质是有限维度的映射,这些有限维度的选择本身就带有必然的主观色彩,我们获得了一些我们想要的知识,也一定忽略了很多信息 。
因果性和相关性的鸿沟在大家的意识中,因果关系是相关性正好等于100%,如果A发生,那么B一定发生,就是相关系数等于1 。假如我和你都是小学生,你和我肯定都在长个子,那么你长高,我也长高,在这5年之内,你长高我也长高的相关性是1 。
大家都知道,因为我和你还在成长期 。不是你长高,我也长高 。或许,你现在看到这里觉得很可笑,这不是谁都知道吗 。但是生活中,各种事情在我们的生活中存在很多,只是我们没有意识到,还有这些事情没有威胁我们的生存 。
对因果关系,最前沿的定义是这样的:
认知科学家珀尔给了一个这样的定义:P(Y | do(X)) > P(Y),也就是说,如果你单方面对 X 做一个干预动作,导致 Y 的概率增加,那么就是 X 导致了 Y,这个可能是目前为止最合理的定义 。
总结接下来,我们总结一下数据科学的边界:

文章插图
世界上有很多问题,其中只有一小部分是数学问题 。在数学问题中,只有一小部分是有解的 。在有解的问题中,只有一部分是理想状态的图灵机可以解决的 。在后一类的问题中,又只有一部分是今天实际的计算机可以解决的,而人工智能可以解决的问题,又只是计算机可以解决问题的一部分,而数据科学只是这些学科的一个交叉而已 。
科学没有解决了所有问题,但是开启了一个去魅的时代,我们更加看清了一些世界的真相 。数据也不能解决所有问题,但是却把天使带到了人间,使普通人也能够调用一代代伟人的智慧 。
反思整个过程可以概括为尝试在一个工程学科建立像数学一样的演绎体系,这可能是个失败的,但对自己来说,也算是一个伟大的失败 。
虽然整个过程写的我自己呕心沥血,耗尽心力,但其实并文章本身没有为了人类的知识体系做出任何补丁和贡献 。
写作的过程是一个不断探索本质的过程,写作的过程不断逼迫自己去思考,去建立概念之间的联系,逼迫自己搞清楚以前模糊的概念,可能这样的写作对自己一个人的意义远远大于对其他人 。
这个过程中也在反思,学习知识,我们到底是皓首穷经的究根问底,还是拿来主义就好?
现在想到的一个折中方案是:
- 不能一直究根问底,毕竟我们的时间精力有限,任何学科的任何一个分支都有可能穷尽我们一生的精力;
- 在调用他人研究成果时 至少需要知道成果中概念的准确含义,成果的假设,成果的结论,结论的限定,其他团体对结果的评价 。
- 广州人或广东人说的捞头,捞妹是什么意思?
- 广东人为什么喜欢叫人“捞佬”或“捞妹”?
- 王者荣耀:周年庆加大奖励,体验皮肤首次免费赠送,或许会人手一个,你满意吗?
- 搞笑领域去什么地方找资源比较好?你有没有珍藏的段子、图片或者笑话?
- 现在哪款5G手机最靠谱,有没有测试或者拆机证明?
- 4G版 现在入手机选4G好还是5G比较好,想入手华为mate30或者Nova6/7或荣耀30?
- 做自媒体,当要用插图或给小视频配乐,去那里找素材。不造成倾权?
- 如果我要做网红爆款服装,有哪些好的货源地或者app推荐呢?
- 有好的视频素材网站或者APP吗?
- 现在干点什么工作好,或者什么生意好?
