正态分布,也称为高斯分布(Gaussian distribution),是概率论与统计学中非常重要的一种连续概率分布。它描述的是随机变量的取值概率,其中数据的高峰位于分布的中央,左右两侧大致对称,形状类似于钟形曲线。正态分布由两个主要参数决定:均值(μ)和标准差(σ)。均值表示数据集的中心位置,而标准差决定了数据的分散程度。
正态分布具有以下特点:
对称性:分布曲线关于均值(μ)对称。
集中性:大部分数据集中在均值附近,离均值越远的数据出现的概率越小。
稳定性:标准差(σ)越小,数据分布越集中在均值附近;σ越大,分布越分散。
正态分布在自然界和社会科学领域中非常常见,很多随机变量的分布都可以近似为正态分布,特别是在大量独立随机因素共同作用的情况下。标准正态分布是均值为0,标准差为1的正态分布,记作N(0,1)