Python案例怎么优化代码性能？

wen python案例 2026-06-09 10

本文目录导读：

Python案例怎么优化代码性能？

先定位：不要盲目优化
常见优化策略（按效果从高到低排列）
完整案例分析
高级优化技术
总结与建议

优化Python代码性能是一个系统工程，需要从多个层面入手，下面我将从工具定位、常见优化策略、具体案例三个维度为你详细讲解。

先定位：不要盲目优化

在开始优化之前，一定要先做性能分析（Profiling），找到真正的瓶颈,常见的工具有：

cProfile - 内置的统计分析器
line_profiler - 逐行分析
memory_profiler - 内存分析

# cProfile 示例
import cProfile
def slow_function():
    total = 0
    for i in range(1000000):
        total += i ** 2
    return total
# 运行分析
cProfile.run('slow_function()')

原则： 先分析，再优化,不要过早优化。

常见优化策略（按效果从高到低排列）

算法与数据结构优化（效果最大）

选择合适的算法和数据结构是最高效的优化。

# ❌ 低效：列表查找 O(n)
def check_in_list(items, target):
    return target in items  # 如果items很长，很慢
# ✅ 高效：集合查找 O(1)
def check_in_set(items, target):
    items_set = set(items)
    return target in items_set
# 实际案例
# ❌ 数据量大时极慢
def find_duplicates_naive(data):
    duplicates = []
    for i in range(len(data)):
        for j in range(i+1, len(data)):
            if data[i] == data[j] and data[i] not in duplicates:
                duplicates.append(data[i])
    return duplicates
# ✅ 使用集合优化
def find_duplicates_optimized(data):
    seen = set()
    duplicates = set()
    for item in data:
        if item in seen:
            duplicates.add(item)
        else:
            seen.add(item)
    return list(duplicates)

使用内置函数和库（通常比纯Python快10-100倍）

Python的C扩展实现的内置函数远快于手写循环。

# ❌ 慢：手动实现
def sum_squares_manual(n):
    total = 0
    for i in range(1, n+1):
        total += i * i
    return total
# ✅ 快：使用数学公式
def sum_squares_formula(n):
    return n * (n + 1) * (2 * n + 1) // 6
# ❌ 慢：列表拼接
def flatten_list_naive(nested):
    result = []
    for sublist in nested:
        for item in sublist:
            result.append(item)
    return result
# ✅ 快：使用列表推导和sum
def flatten_list_optimized(nested):
    return sum(nested, [])  # 但注意，这不是最优的
# ✅ 更优：itertools
import itertools
def flatten_list_itertools(nested):
    return list(itertools.chain.from_iterable(nested))

避免不必要的循环和函数调用

# ❌ 慢：在循环中重复计算
def process_bad(data):
    result = []
    for i in range(len(data)):  # 每次循环都计算len(data)
        if data[i] % 2 == 0:
            result.append(data[i] ** 2)
    return result
# ✅ 快：预计算和直接迭代
def process_good(data):
    result = []
    length = len(data)  # 预计算
    for i in range(length):
        if data[i] % 2 == 0:
            result.append(data[i] ** 2)
    return result
# ✅ 更快：使用列表推导
def process_best(data):
    return [x ** 2 for x in data if x % 2 == 0]

局部变量与全局变量

访问局部变量比全局变量快。

# ❌ 慢：频繁访问全局变量
PI = 3.14159
def calculate_area_global(radius):
    return PI * radius * radius
# ✅ 快：使用局部变量
def calculate_area_local(radius):
    pi = 3.14159  # 局部变量
    return pi * radius * radius

使用生成器节省内存

当处理大数据集时,使用生成器代替列表。

# ❌ 占用大量内存
def load_large_file_bad(filename):
    with open(filename) as f:
        return f.readlines()  # 一次性读入内存
# ✅ 节省内存：生成器
def load_large_file_good(filename):
    with open(filename) as f:
        for line in f:  # 逐行读取，不占用大量内存
            yield line.strip()

使用NumPy进行数值计算

对于大量数值计算，NumPy比纯Python快10-100倍。

import numpy as np
import time
# ❌ 纯Python
def python_square_sum(n):
    total = 0
    for i in range(n):
        total += i ** 2
    return total
# ✅ NumPy
def numpy_square_sum(n):
    arr = np.arange(n)
    return np.sum(arr ** 2)
# 性能对比
n = 10000000
start = time.time()
python_square_sum(n)
print(f"Python: {time.time() - start:.2f}秒")
start = time.time()
numpy_square_sum(n)
print(f"NumPy: {time.time() - start:.2f}秒")
# NumPy 通常快 10-50 倍

完整案例分析

案例：处理大量文本数据

假设我们要处理一个包含100万条用户评论的CSV文件，统计每个单词出现的频率（词频统计）。

import csv
import time
from collections import Counter
import re
# ❌ 低效实现
def word_count_naive(filename):
    word_counts = {}
    with open(filename, 'r', encoding='utf-8') as f:
        reader = csv.reader(f)
        next(reader)  # 跳过表头
        for row in reader:
            # 这里假设评论在第2列
            text = row[1].lower()
            # 简单的分词
            words = text.split()
            for word in words:
                # 清理标点符号 - 在循环内做，很慢
                word = word.strip('.,!?()[]{}"\'')
                if word:  # 跳过空字符串
                    if word in word_counts:
                        word_counts[word] += 1
                    else:
                        word_counts[word] = 1
    return word_counts
# ✅ 优化实现
def word_count_optimized(filename):
    # 使用Counter替代手动字典操作
    word_counts = Counter()
    with open(filename, 'r', encoding='utf-8') as f:
        reader = csv.reader(f)
        next(reader)  # 跳过表头
        # 预编译正则表达式，加速标点清理
        pattern = re.compile(r'[.,!?()\[\]{}"\'"]')
        for row in reader:
            text = row[1].lower()
            # 一次性清理所有标点并分词
            words = pattern.sub('', text).split()
            # 使用Counter的update方法
            word_counts.update(words)
    return word_counts
# ✅ 进一步优化：使用列表推导和join
def word_count_best(filename):
    word_counts = Counter()
    pattern = re.compile(r'[.,!?()\[\]{}"\'"]')
    with open(filename, 'r', encoding='utf-8') as f:
        reader = csv.reader(f)
        next(reader)
        # 将所有文本收集起来，减少文件I/O次数
        all_text = []
        for row in reader:
            all_text.append(row[1].lower())
    # 批量处理
    text = ' '.join(all_text)
    words = pattern.sub('', text).split()
    word_counts.update(words)
    return word_counts

性能对比（假设100万条数据）：

低效实现：约45秒
优化实现：约8秒（快5-6倍）
进一步优化：约3秒（快15倍）

高级优化技术

当常规优化达到瓶颈时,可以考虑这些高级技术：

使用`slots`优化类

# ❌ 默认：每个实例都有__dict__
class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y
# ✅ 优化：使用__slots__节省内存并加速属性访问
class PointOptimized:
    __slots__ = ('x', 'y')  # 固定属性名
    def __init__(self, x, y):
        self.x = x
        self.y = y

使用本地变量绑定

# ❌ 慢：在循环中访问全局函数
def process_bad(items):
    result = []
    for item in items:
        result.append(str(item.upper()))  # 每次都要查找str和upper
    return result
# ✅ 快：本地绑定
def process_good(items):
    result = []
    str_upper = str.upper  # 本地绑定
    for item in items:
        result.append(str_upper(item))
    return result

使用C扩展（严重性能瓶颈时）

对于极端性能需求,考虑：

Cython - 将Python代码编译成C扩展
Numba - 即时编译（JIT）加速

from numba import jit
import numpy as np
# 使用Numba加速数值计算
@jit(nopython=True)
def numba_sum_squares(n):
    total = 0
    for i in range(n):
        total += i ** 2
    return total
# 比纯Python快100倍以上