别再死记硬背公式了！用Python模拟10000次抛硬币，直观理解大数定律与中心极限定理

张开发

• 2026/5/6 1:46:12 • 15 分钟阅读

分享文章

别再死记硬背公式了！用Python模拟10000次抛硬币，直观理解大数定律与中心极限定理

用Python模拟10000次抛硬币可视化理解大数定律与中心极限定理概率论中那些看似晦涩的数学公式其实背后隐藏着极其直观的规律。今天我们不谈枯燥的推导过程而是用Python代码和可视化手段带你亲身体验概率的魔力。想象一下当你连续抛硬币10000次结果会怎样随着实验次数的增加正反面出现的比例会发生什么变化这些现象正是大数定律和中心极限定理在现实中的完美体现。1. 实验准备构建硬币抛掷模拟器在开始之前我们需要搭建一个简单的实验环境。Python的科学计算库NumPy和可视化库Matplotlib将成为我们的得力助手。import numpy as np import matplotlib.pyplot as plt plt.style.use(seaborn) # 使用更美观的绘图风格 # 设置随机种子保证结果可复现 np.random.seed(42)硬币抛掷本质上是一个伯努利试验每次实验只有两种可能结果正面为1反面为0且概率相等假设硬币公平。我们可以用NumPy的random模块轻松模拟这个过程def flip_coin(n_times): 模拟抛硬币n次返回结果数组 return np.random.choice([0, 1], sizen_times)提示在实际应用中可以通过调整p参数来模拟不公平硬币例如p0.4表示正面朝上的概率为40%。2. 大数定律的直观展示大数定律告诉我们随着实验次数的增加样本均值会越来越接近理论期望值。让我们用代码来验证这一点。2.1 单次实验的累积均值变化def plot_cumulative_mean(flips): 绘制累积均值变化曲线 cumulative_means np.cumsum(flips) / (np.arange(len(flips)) 1) plt.figure(figsize(12, 6)) plt.plot(cumulative_means, label实际比例) plt.axhline(0.5, colorred, linestyle--, label理论期望) plt.xlabel(抛硬币次数) plt.ylabel(正面比例) plt.title(大数定律演示抛硬币正面比例随实验次数的变化) plt.legend() plt.grid(True) plt.show() # 模拟10000次抛硬币 flips flip_coin(10000) plot_cumulative_mean(flips)运行这段代码你会看到一条波动逐渐减小的曲线最终稳定在0.5附近。这正是弱大数定律的直观表现——随着实验次数n→∞样本均值收敛于总体期望。2.2 多次独立实验的对比为了更全面地理解我们可以进行多组独立实验观察它们的收敛情况def plot_multiple_experiments(n_experiments5, n_flips10000): 绘制多组实验的累积均值曲线 plt.figure(figsize(12, 6)) for _ in range(n_experiments): flips flip_coin(n_flips) cumulative_means np.cumsum(flips) / (np.arange(n_flips) 1) plt.plot(cumulative_means, alpha0.6) plt.axhline(0.5, colorred, linestyle--, linewidth2) plt.xlabel(抛硬币次数) plt.ylabel(正面比例) plt.title(f{n_experiments}组独立实验的累积均值对比) plt.grid(True) plt.show() plot_multiple_experiments(n_experiments10)你会观察到虽然不同实验的初期波动各异但随着实验次数增加所有曲线都向0.5靠拢。这验证了辛钦大数定律的核心观点——独立同分布随机变量的样本均值依概率收敛于期望值。3. 中心极限定理的可视化如果说大数定律关注的是均值的收敛行为那么中心极限定理则揭示了样本和的分布形态。它告诉我们无论原始分布如何大量独立随机变量和的标准化形式都近似服从正态分布。3.1 从二项分布到正态分布抛硬币n次的总正面次数服从二项分布B(n,p)。让我们观察随着n增大这个分布如何变化def plot_binomial_distribution(n_list[10, 50, 100, 1000]): 不同实验次数下的二项分布可视化 fig, axes plt.subplots(2, 2, figsize(14, 10)) axes axes.ravel() for i, n in enumerate(n_list): # 模拟10000组实验每组抛n次硬币 results np.sum(flip_coin(n), axis1) for _ in range(10000) axes[i].hist(results, bins30, densityTrue, alpha0.7) # 绘制对应的正态分布曲线 mu n * 0.5 sigma np.sqrt(n * 0.5 * 0.5) x np.linspace(mu - 3*sigma, mu 3*sigma, 100) axes[i].plot(x, 1/(sigma * np.sqrt(2 * np.pi)) * np.exp(-0.5 * ((x - mu)/sigma)**2), linewidth2, colorred) axes[i].set_title(fn{n}) axes[i].set_xlabel(正面次数) axes[i].set_ylabel(概率密度) plt.suptitle(二项分布随n增大逐渐接近正态分布) plt.tight_layout() plt.show() plot_binomial_distribution()从图中可以清晰看到当n较小时分布呈离散的二项分布形态随着n增大分布越来越接近连续的正态分布曲线。3.2 标准化后的分布比较为了更准确地验证中心极限定理我们需要对结果进行标准化处理def demonstrate_clt(n1000, n_experiments10000): 中心极限定理的标准化演示 # 模拟实验 samples np.array([np.sum(flip_coin(n)) for _ in range(n_experiments)]) # 标准化 mu n * 0.5 sigma np.sqrt(n * 0.5 * 0.5) standardized (samples - mu) / sigma # 绘制直方图与标准正态分布对比 plt.figure(figsize(12, 6)) plt.hist(standardized, bins50, densityTrue, alpha0.7, label标准化结果) # 标准正态分布曲线 x np.linspace(-4, 4, 100) plt.plot(x, 1/np.sqrt(2 * np.pi) * np.exp(-0.5 * x**2), r-, lw2, label标准正态分布) plt.xlabel(标准化值) plt.ylabel(概率密度) plt.title(中心极限定理验证标准化后的分布与标准正态分布比较) plt.legend() plt.grid(True) plt.show() demonstrate_clt(n1000)这幅图展示了标准化后的分布与标准正态分布N(0,1)的惊人吻合。即使原始数据是离散的二项分布经过标准化处理后当n足够大时其分布形态确实趋近于正态分布。4. 切比雪夫不等式的实证检验切比雪夫不等式给出了随机变量偏离期望值的概率上界。让我们用实验数据来验证这个理论。4.1 不等式原理回顾切比雪夫不等式表述为对于任意ε0 P(|X-μ|≥ε) ≤ σ²/ε²其中μ是期望σ²是方差。对于我们的硬币实验μ 0.5σ² p(1-p) 0.254.2 实验验证我们计算不同ε值下的实际偏离概率和理论上界def verify_chebyshev(n10000, k_valuesnp.arange(1, 5, 0.5)): 验证切比雪夫不等式 flips flip_coin(n) mean np.mean(flips) std np.std(flips) results [] for k in k_values: epsilon k * std actual np.mean(np.abs(flips - mean) epsilon) bound 1 / k**2 results.append((k, epsilon, actual, bound)) # 结果表格展示 print(k\tε\t实际概率\t理论上界) for r in results: print(f{r[0]:.1f}\t{r[1]:.4f}\t{r[2]:.4f}\t{r[3]:.4f}) verify_chebyshev()输出结果类似如下具体数值可能因随机性略有不同k ε 实际概率理论上界 1.0 0.5000 0.0000 1.0000 1.5 0.7500 0.0000 0.4444 2.0 1.0000 0.0000 0.2500 2.5 1.2500 0.0000 0.1600 3.0 1.5000 0.0000 0.1111 3.5 1.7500 0.0000 0.0816 4.0 2.0000 0.0000 0.0625 4.5 2.2500 0.0000 0.0494从结果可见实际观测到的偏离概率确实小于切比雪夫不等式给出的理论上界验证了这个不等式确实成立。5. 实际应用概率估计与误差分析理解了这些理论后我们可以解决一些实际问题。比如抛1000次硬币正面次数在450到550之间的概率是多少5.1 理论计算根据中心极限定理我们可以用正态分布近似计算def estimate_probability(n, a, b): 估计正面次数在[a,b]区间内的概率 mu n * 0.5 sigma np.sqrt(n * 0.5 * 0.5) # 标准化 z_a (a - mu) / sigma z_b (b - mu) / sigma # 使用标准正态分布计算概率 from scipy.stats import norm prob norm.cdf(z_b) - norm.cdf(z_a) return prob print(f理论估计概率: {estimate_probability(1000, 450, 550):.4f})5.2 模拟验证让我们通过模拟来验证这个理论估计def simulate_probability(n, a, b, n_simulations100000): 通过模拟计算概率 results np.array([np.sum(flip_coin(n)) for _ in range(n_simulations)]) prob np.mean((results a) (results b)) return prob simulated_prob simulate_probability(1000, 450, 550) print(f模拟结果概率: {simulated_prob:.4f})在我的测试中理论估计约为0.9747而模拟结果约为0.9742两者非常接近。这种一致性正是中心极限定理强大之处的体现。6. 进阶探索不同概率分布的收敛速度有趣的是不同形状的原始分布其收敛到正态分布的速度也不同。我们可以比较几种常见分布的情况def compare_convergence(distributions, n_list[10, 30, 100, 1000]): 比较不同分布的收敛速度 fig, axes plt.subplots(len(distributions), len(n_list), figsize(16, 12)) for i, (name, dist_func) in enumerate(distributions.items()): for j, n in enumerate(n_list): # 生成标准化样本 samples np.array([dist_func(n) for _ in range(10000)]) mu, sigma np.mean(samples), np.std(samples) standardized (samples - mu) / sigma # 绘制直方图 axes[i,j].hist(standardized, bins50, densityTrue, alpha0.7) # 标准正态曲线 x np.linspace(-4, 4, 100) axes[i,j].plot(x, 1/np.sqrt(2 * np.pi) * np.exp(-0.5 * x**2), r-, lw1) axes[i,j].set_title(f{name}, n{n}) plt.tight_layout() plt.show() # 定义几种不同的分布 distributions { 均匀分布: lambda n: np.sum(np.random.uniform(-1, 1, n)), 指数分布: lambda n: np.sum(np.random.exponential(1, n)), 二项分布: lambda n: np.sum(flip_coin(n)) } compare_convergence(distributions)从对比图中可以发现均匀分布的收敛速度最快而指数分布等偏态分布的收敛相对较慢。这提醒我们在实际应用中需要根据数据特性判断样本量是否足够使中心极限定理生效。

更多文章

前端开发 2026/4/11 20:47:09

OpenClaw开源贡献指南：为Qwen3-14b_int4_awq开发社区技能

OpenClaw开源贡献指南：为Qwen3-14b_int4_awq开发社区技能 1. 为什么选择OpenClaw生态贡献去年冬天，当我第一次尝试用OpenClaw自动化处理日报时，发现现有的技能库缺少对中文PDF解析的支持。在社区搜索无果后，我决定自己动手开发…

张开发

前端开发 2026/4/11 20:47:07

Escornabot-lib：面向教育机器人的Arduino语义化控制库

1. Escornabot-lib 库概述Escornabot-lib 是一个专为 Escornabot 教育机器人设计的 Arduino C 类库，由 ROBOteach 团队维护，采用 GNU GPL v3.0 开源协议。该库并非仅提供抽象接口，而是完整封装了 Escornabot 硬件平台的全部底层驱动、状态管理…

张开发

前端开发 2026/4/18 10:06:27

ConcurrentHashMap 为什么比 HashMap 安全？

点击上方“java大数据修炼之道”, 选择“设为星标”技术干货发文后 👉 第一时间奉上引言上一篇我们深入分析了 HashMap 的源码，今天来聊聊它的线程安全版本 ConcurrentHashMap。很多人知道"HashMap 线程不安全，多线程用 ConcurrentHashM…

张开发

前端开发 2026/4/12 19:17:00

开源大模型部署案例：Pixel Language Portal镜像免配置快速上手教程

开源大模型部署案例：Pixel Language Portal镜像免配置快速上手教程 1. 产品概览 Pixel Language Portal（像素语言跨维传送门）是一款基于Tencent Hunyuan-MT-7B大模型构建的创新翻译工具。与传统翻译软件不同，它将语言转换过程设…

张开发

前端开发 2026/4/12 19:16:58

Vite多入口页面配置实战：从单页应用到多页项目的平滑升级指南

Vite多入口页面配置实战：从单页应用到多页项目的平滑升级指南当你已经用Vite构建了一个优雅的单页应用，突然业务需求要求你扩展为多页项目时，是否感到手足无措？别担心，这种架构演进在项目成长过程中再常见不过了。作为…

张开发

前端开发 2026/4/12 19:16:56

猫抓插件：革新性浏览器资源捕获工具完全指南

猫抓插件：革新性浏览器资源捕获工具完全指南【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 在数字内容爆炸的时代，每3位互…

张开发

前端开发 2026/4/12 19:16:55

Qwen3.5-9B从零开始部署：Conda环境配置+模型路径符号链接避坑指南

Qwen3.5-9B从零开始部署：Conda环境配置模型路径符号链接避坑指南 1. 项目概述 Qwen3.5-9B是一款拥有90亿参数的开源大语言模型，具备强大的逻辑推理、代码生成和多轮对话能力。该模型支持多模态理解（图文输入）和长上下文处理&…

张开发

前端开发 2026/4/15 10:26:33

告别PX4，试试APM！用ArduPilot+Gazebo搭建你的第一个无人机仿真环境（附QGC地面站连接）

从PX4到APM：ArduPilot无人机仿真环境全攻略如果你已经熟悉PX4生态，却对ArduPilot（APM）固件在仿真领域的表现充满好奇，这篇文章将为你打开一扇新的大门。不同于市面上大量聚焦PX4的教程，我们将深入探讨APM在…

张开发

前端开发 2026/4/12 19:16:51

保姆级教程：在Ubuntu 18.04上搞定速腾Helios雷达驱动与fast-LIO2的初次握手

速腾Helios雷达与fast-LIO2实战指南：从驱动配置到点云可视化第一次接触速腾聚创的Helios激光雷达和fast-LIO2算法时，我完全理解那种既兴奋又忐忑的心情。作为一款高性价比的32线激光雷达，Helios在SLAM、自动驾驶和三维重建领域有着广泛应用&…

张开发

前端开发 2026/4/25 10:43:27

CH341安卓库实战：从官方Demo到集成到自己App的完整避坑指南

CH341安卓库实战：从官方Demo到集成到自己App的完整避坑指南在智能家居中控或工业设备配置终端的开发中，串口通信往往是连接硬件设备的关键桥梁。而CH341作为一款广泛使用的USB转串口芯片，其安卓库的集成质量直接决定了应用的稳定性和用户体验…

张开发

前端开发 2026/4/12 19:16:48

WZ文件编辑神器：Harepacker-resurrected从入门到精通的完整指南

WZ文件编辑神器：Harepacker-resurrected从入门到精通的完整指南【免费下载链接】Harepacker-resurrected All in one .wz file/map editor for MapleStory game files 项目地址: https://gitcode.com/gh_mirrors/ha/Harepacker-resurrected Harepacker-resu…

张开发

前端开发 2026/4/12 19:16:46

JAVA FTPClient 文件时间时区转换实战（UTC与CST的8小时之谜）

1. 问题背景：FTP文件时间为何总是慢8小时？ 最近在做一个文件同步系统时，遇到了一个奇怪的现象：通过Java的FTPClient从服务器下载文件时，获取到的文件最后修改时间总是比实际时间慢了整整8小时。比如服务器上某个文件明…

张开发

别再死记硬背公式了！用Python模拟10000次抛硬币，直观理解大数定律与中心极限定理

最新文章

EF Core 10向量搜索扩展仅支持.NET 8+？不！这3种降级兼容方案已被头部金融客户验证上线

从Kaggle竞赛到工业落地：MATLAB环境下XGBoOST调参的实战避坑指南

保姆级教程：用Python和LQR从零实现自动驾驶横向控制（附MATLAB代码对比）

别再自己搭文件服务器了！Spring Boot整合阿里云OSS，5分钟搞定图片上传功能

高德/百度地图API实战：如何用AOI数据给你的POI打上“商圈”标签？

架构师视角：vue-office在企业级文档预览系统中的技术实现与优化策略

推荐文章

相关文章

分享文章

更多文章

OpenClaw开源贡献指南：为Qwen3-14b_int4_awq开发社区技能

Escornabot-lib：面向教育机器人的Arduino语义化控制库

ConcurrentHashMap 为什么比 HashMap 安全？

开源大模型部署案例：Pixel Language Portal镜像免配置快速上手教程

Vite多入口页面配置实战：从单页应用到多页项目的平滑升级指南

猫抓插件：革新性浏览器资源捕获工具完全指南

Qwen3.5-9B从零开始部署：Conda环境配置+模型路径符号链接避坑指南

告别PX4，试试APM！用ArduPilot+Gazebo搭建你的第一个无人机仿真环境（附QGC地面站连接）

保姆级教程：在Ubuntu 18.04上搞定速腾Helios雷达驱动与fast-LIO2的初次握手

CH341安卓库实战：从官方Demo到集成到自己App的完整避坑指南

WZ文件编辑神器：Harepacker-resurrected从入门到精通的完整指南

JAVA FTPClient 文件时间时区转换实战（UTC与CST的8小时之谜）