前端也能读懂的机器学习基础篇——概率视角

2020-04-21 00:00:00 都是 样本 描述 概率 随机

近几年机器学习非常火,几乎每一个项目组都在思考自己手头的项目能不能用机器学习的方法进行优化。对于前端同学来说,有一个主要的难点在于前端技术栈和机器学习所需要的基础技能有很大的gap,市面上的机器学习的基础教程,对读者的数学基础要求偏高,有些基本的原理或者世界观,被当做自然而然的事情忽略,会导致理解上的困难。本文试着填补一下从高中数学到通常的机器学习入门之间的空白。


概率论回忆


随机事件:在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件)

样本空间:随机事件所有结果的总和

随机变量:随机事件的结果对应的数字,随机变量本质上来讲,是样本空间的子集到实数空间的一个映射。


举例来说,连续扔两次硬币,H记为正面向上,T表示背面向上,那么样本空间就可以记为


,我们定义一个随机变量X,叫做抛硬币结果中出现正面的个数,于是有下表:


相关文章