什么是正态分布?正态分布(Normal Distribution),统计学中的一个重要概念,又称高斯分布,代表概率分布。
在科学理论不发达的过去,早期科学家往往从观察事物现象开始,发现、记录和总结,最终抽象出背后的规律。
当一组观察数据或样本涉及平均和偏差时,它们的频率通常被描述为以下曲线:
图自百度百科
图中的横轴代表样本值,纵轴是对应样本值的概率,其中该曲线为正态分布曲线。
观察图形,正态曲线呈钟形 x=μ (平均位置)中心左右对称。曲线无限接近横轴,合成面积为 1.代表所有样本的概率之和 100%。
用数学语言描述曲线,
期望(均数)包含两个参数μ 和标准差 σ。
我们常用更简化的形式来描述什么是正态分布:N(μ,σ^2);μ 它代表离代表分布的集中趋势 μ 值越近,出现的概率越大; σ^2 (方差)代表数据分布的离散程度,σ 数据分布越大,曲线越矮胖。
事实上,许多变量(包括生成制造、科学实验和一些自然现象)的分布接近正态分布,如一群人的身高或脚的大小,我每天上班所需的时间,以及班上所有学生的中文成绩。
这一规律之所以出现,是因为上述样本基于大量随机变量重复实验,就像我每天上班一样=重复(唉),地铁是否挤到两趟都上不去,我是否因为玩手机而坐过车站,在两个十字路口行走时遇到红灯或绿灯等变量=随机。
它背后的理论支持称为中心极限定理(对数学史感兴趣的朋友可以点击n重伯努利实验进一步了解)。
了解什么是正态分布,对我们有什么用?
你可以试着在现实生活中找到类似于工作时间的重复随机事件,记录不同情况的次数,统计频率,并将其描述成图片(Excel 可轻松实现),检查其形状是否接近正态分布。
当你积累足够的数据,出现一些神秘的规律特征时,未发生的事件很可能会落在一个可信的范围内。
相信看完这篇文章,你已经大致了解了什么是正态分布,并且可以在生活中找到它的存在,并用它来预测未来。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。