数据分布类型可以分为离散型分布和连续型分布。以下是它们各自的一些常见类型:
离散型分布
伯努利分布
符号表示:X ~ B(x,p)
期望:E[X] = p
方差:Var[X] = p(1-p)
二项分布
符号表示:X ~ B(n,p)
期望:E[X] = np
方差:Var[X] = np(1-p)
几何分布
符号表示:X ~ GE(p)
期望:E[X] = 1/p
方差:Var[X] = (1-p)/p^2
泊松分布
符号表示:X ~ P(λ)
期望:E[X] = λ
方差:Var[X] = λ
连续型分布
均匀分布
符号表示:X ~ U(a,b)
期望:E[X] = (a+b)/2
方差:Var[X] = (b-a)^2/12
指数分布
符号表示:X ~ E(λ)
期望:E[X] = 1/λ
方差:Var[X] = 1/λ^2
正态分布
符号表示:X ~ N(μ,σ^2)
期望:E[X] = μ
方差:Var[X] = σ^2
t分布
用于小样本情况下估计正态分布总体均值
F分布
用于方差分析(ANOVA)和回归分析中的F检验
伽玛分布
用于描述某些类型的等待时间,如电话呼叫的到达时间
贝塔分布
用于描述成功概率在0到1之间的随机变量的分布
威布尔分布
用于描述故障时间或寿命分布
卡方分布
用于检验拟合优度或独立性检验
偏态分布
描述数据分布的不对称性
卡方分布
用于检验拟合优度或独立性检验
这些分布类型在统计学、概率论、工程、自然科学和社会科学等领域有着广泛的应用。每种分布都有其特定的概率密度函数、期望值和方差,它们决定了数据分布的形状和特征