Python案例怎么计算数据标准差？

wen python案例 2026-06-07 52

本文目录导读：

Python案例怎么计算数据标准差？

使用 statistics 模块（标准库）
使用 NumPy 库（更常用）
手动计算标准差（理解原理）
实际应用案例
关键概念说明
选择建议

在Python中计算数据标准差有多种方法,下面我为你详细介绍几种常见的方式：

使用 statistics 模块（标准库）

import statistics
# 示例数据
data = [85, 92, 78, 95, 88, 70, 82, 90]
# 计算总体标准差
pop_std = statistics.pstdev(data)
print(f"总体标准差: {pop_std:.2f}")  # 输出: 8.04
# 计算样本标准差
sample_std = statistics.stdev(data)
print(f"样本标准差: {sample_std:.2f}")  # 输出: 8.59

使用 NumPy 库（更常用）

import numpy as np
data = [85, 92, 78, 95, 88, 70, 82, 90]
# 总体标准差 (ddof=0)
pop_std = np.std(data)
print(f"总体标准差: {pop_std:.2f}")  # 输出: 8.04
# 样本标准差 (ddof=1)
sample_std = np.std(data, ddof=1)
print(f"样本标准差: {sample_std:.2f}")  # 输出: 8.59
# ddof参数说明：
# ddof=0: 总体标准差 (除以n)
# ddof=1: 样本标准差 (除以n-1)

手动计算标准差（理解原理）

import math
def calculate_std(data, sample=True):
    """
    手动计算标准差
    :param data: 数据列表
    :param sample: True为样本标准差，False为总体标准差
    """
    n = len(data)
    mean = sum(data) / n
    # 计算方差
    variance = sum((x - mean) ** 2 for x in data)
    if sample:
        variance /= (n - 1)  # 样本标准差
    else:
        variance /= n  # 总体标准差
    return math.sqrt(variance)
# 使用示例
data = [85, 92, 78, 95, 88, 70, 82, 90]
pop_std = calculate_std(data, sample=False)
sample_std = calculate_std(data, sample=True)
print(f"总体标准差: {pop_std:.2f}")     # 输出: 8.04
print(f"样本标准差: {sample_std:.2f}")  # 输出: 8.59

实际应用案例

import numpy as np
import matplotlib.pyplot as plt
# 实际案例：分析股票收益率数据
# 假设我们有一周5天的日收益率数据
daily_returns = [0.02, -0.015, 0.03, 0.01, -0.005]  # 2%, -1.5%, 3%, 1%, -0.5%
returns_np = np.array(daily_returns)
# 计算各项统计指标
mean_return = np.mean(returns_np)  # 平均收益率
std_return = np.std(returns_np, ddof=1)  # 样本标准差
variance = np.var(returns_np, ddof=1)  # 样本方差
print("股票收益率分析:")
print(f"平均收益率: {mean_return*100:.2f}%")
print(f"收益率标准差: {std_return*100:.2f}%")
print(f"收益率方差: {variance*100:.4f}")
# 可视化分析
plt.figure(figsize=(10, 5))
# 绘制收益率曲线
plt.subplot(1, 2, 1)
plt.plot(daily_returns, 'bo-', linewidth=2, markersize=8)
plt.axhline(y=mean_return, color='r', linestyle='--', label=f'均值: {mean_return*100:.2f}%')
plt.axhline(y=mean_return + std_return, color='g', linestyle=':', label=f'+1σ: {(mean_return+std_return)*100:.2f}%')
plt.axhline(y=mean_return - std_return, color='g', linestyle=':', label=f'-1σ: {(mean_return-std_return)*100:.2f}%')
plt.xlabel('交易日')
plt.ylabel('收益率')'每日收益率变化')
plt.legend()
plt.grid(True, alpha=0.3)
# 绘制收益分布直方图
plt.subplot(1, 2, 2)
plt.hist(daily_returns, bins=5, edgecolor='black', alpha=0.7)
plt.axvline(x=mean_return, color='r', linestyle='--', label=f'均值: {mean_return*100:.2f}%')
plt.axvline(x=mean_return + std_return, color='g', linestyle=':', label='±1σ')
plt.axvline(x=mean_return - std_return, color='g', linestyle=':')
plt.xlabel('收益率')
plt.ylabel('频次')'收益率分布')
plt.legend()
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()