了解条件熵

2025-01-12

Word count: 702 | Reading time≈ 2 min

条件熵（Conditional Entropy）是信息论中的一个概念，用于衡量在给定某个随机变量的情况下，另一个随机变量的不确定性。假设我们有两个随机变量 $X$ 和 $Y$，则 $Y$ 在给定 $X$ 的条件下的条件熵 $H(Y|X)$ 定义为：

$$ H(Y|X) = \sum_{x \in X} p(x) H(Y|X=x) $$

其中 $p(x)$ 是 $X$ 取值为 $x$ 的概率，而 $H(Y|X=x)$ 是在 $X=x$ 条件下 $Y$ 的熵。

为了计算条件熵，我们需要以下步骤：

计算每个样本的概率分布。
对于每一个可能的 $X$ 值，计算对应的 $Y$ 的熵。
根据上述公式计算条件熵。

下面是一个用 Python 实现这个计算的示例代码。假设输入数据为一个二维列表 data ，其中每一行代表一个样本，第一个元素为 $X$ 的值，后面的元素为 $Y$ 的值。

import numpy as np
from collections import Counter, defaultdict

def calculate_entropy(probabilities):
    """
    计算给定概率分布的熵
    :param probabilities: 一个包含概率的列表
    :return: 熵的值
    """
    entropy = -sum([p * np.log2(p) for p in probabilities if p > 0])
    return entropy

def conditional_entropy(data):
    """
    计算条件熵 H(Y|X)
    :param data: 二维列表，每一行表示一个样本 [x, y1, y2, ...]
    :return: 条件熵 H(Y|X)
    """
    # Step 1: 统计 X 的取值及其出现的次数
    x_counts = Counter([row[0] for row in data])
    total_samples = len(data)
    
    # Step 2: 对每一个 x 的取值，统计 Y 的概率分布
    conditional_probs = defaultdict(list)
    for row in data:
        x_val = row[0]
        y_vals = row[1:]
        conditional_probs[x_val].append(tuple(y_vals))  # 将 y_vals 转为 tuple 以方便计数
    
    # Step 3: 计算条件熵
    h_y_given_x = 0.0
    for x_val, count in x_counts.items():
        p_x = count / total_samples
        
        # 统计当前 x 下所有 y 的组合及其出现次数
        y_combinations_count = Counter(conditional_probs[x_val])
        num_y_given_x = sum(y_combinations_count.values())
        
        # 计算在当前 x 下 Y 的熵
        if num_y_given_x > 0:
            probabilities_y_given_x = [count_y / num_y_given_x for count_y in y_combinations_count.values()]
            h_y_given_x_val = calculate_entropy(probabilities_y_given_x)
        else:
            h_y_given_x_val = 0  # 如果没有 y 组合，则熵为 0
        
        # 加权求和得到总的条件熵
        h_y_given_x += p_x * h_y_given_x_val
    
    return h_y_given_x

# 示例数据
data = [
    [0, 0, 0],
    [0, 1, 0],
    [1, 0, 1],
    [1, 1, 1],
    [1, 0, 0]
]

# 计算条件熵
result = conditional_entropy(data)
print("条件熵 H(Y|X):", result)

解释

calculate_entropy 函数用于计算给定概率分布的熵。
conditional_entropy 函数首先统计 $X$ 的取值及其频率，然后对于每一个 $X$ 的取值，统计对应 $Y$ 的联合分布并计算其熵，最后根据条件熵的定义进行加权求和。

注意：

这个实现假设了 $Y$ 是一个多维向量，并将其视为一个整体来计算联合分布和熵。如果 $Y$ 是单个变量，可以简化处理逻辑。
代码中的 np.log2 用于计算以 2 为底的对数，这是信息论中常用的对数形式。

Donate

Copyright： Copyright is owned by the author. For commercial reprints, please contact the author for authorization. For non-commercial reprints, please indicate the source.