优化 model_norm 方法 #26

volmodaoist · 2024-07-27T18:16:53Z

对于张量运算应尽量避免使用循环，原版的 model_norm 函数 (i.e. 计算两个模型之间的欧式距离) 使用 for 实现，导致效率偏低且可读性差。为此我们优化了原版 model_norm 方法，增强了可读性且运行效率提高了一倍，若在 GPU 环境之中运行代码，性能提升会更加显著。

# 原本的 model_norm 方法之中的 for 循环导致其无法充分利用 GPU 加速
def model_norm(model_1, model_2):
	squared_sum = 0
	for name, layer in model_1.named_parameters():
		squared_sum += torch.sum(torch.pow(layer.data - model_2.state_dict()[name].data, 2))
	return math.sqrt(squared_sum)

# 优化之后的 model_norm 方法，这个方法兼具运行效率与可读性
def model_norm2(model_1, model_2):
    params_1 = torch.cat([param.view(-1) for param in model_1.parameters()])
    params_2 = torch.cat([param.view(-1) for param in model_2.parameters()])
    
    return torch.norm(params_1 - params_2, p = 2)
    
# 如果牺牲一部分可读性，其运行效率可以进一步提高，实战之中使用下面代码能有效缩短模型训练的时间。
def quick_model_norm(model_1, model_2):
    diffs = [(p1 - p2).view(-1) for p1, p2 in zip(model_1.parameters(), model_2.parameters())]
    return torch.norm(torch.cat(diffs), p = 2)

为此我们优化了原版 model_norm 方法，增强了可读性且运行效率提高了一倍，若在 GPU 环境之中运行代码，性能提升会更加明显。 Signed-off-by: volmodaoist <[email protected]>

volmodaoist force-pushed the dev branch from a46a217 to 55f82ab Compare July 27, 2024 18:21

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

优化 model_norm 方法 #26

优化 model_norm 方法 #26

volmodaoist commented Jul 27, 2024

优化 model_norm 方法 #26

Are you sure you want to change the base?

优化 model_norm 方法 #26

Conversation

volmodaoist commented Jul 27, 2024