Deepseek v2 16b enablement #34

hakankiymaz-amd · 2024-12-10T18:32:06Z

Deepseek v2 16b enablement
test_report.csv
MI300X-DeepSeek-V2-Lite-bf16-seq2048-tp1pp1ep8-mbsgbs-ac_sel-do_true-fa_true-sp_true-20241210_173933.log

throughput per GPU: 611.822
All tests passed

megatron/core/transformer/transformer_layer.py

megatron/training/utils.py

wenchenvincent · 2024-12-11T05:21:29Z

megatron/core/models/deepseekv2/yarn_rotary_pos_embedding.py

+    ramp_func = torch.clamp(linear_func, 0, 1)
+    return ramp_func
+
+class DeepseekV2YarnRotaryEmbedding(DeepseekV2RotaryEmbedding):


Can we use YarnRotaryEmbedding from megatron.core.models.common.embeddings.yarn_rotary_pos_embedding instead?

megatron/core/models/deepseekv2/transformer_layer.py

megatron/core/models/deepseekv2/transformer_block.py

examples/deepseek_v2/pretrain_deepseek.py

megatron/core/models/deepseekv2/model.py

megatron/training/utils.py

wenchenvincent · 2024-12-17T18:35:20Z

@hakankiymaz-amd Could you also make sure the copyright statements are all applied properly? If files are copied over from PAI-megatron-patch without any change, you should keep the original copyright statement there. If it is incorporated with your change, You need to add additional copyright statement for AMD and specify what are the changes.

hakankiymaz-amd · 2024-12-18T12:53:09Z

Copyright statements are added proper to changes from PAI and changes from AMD.

hakankiymaz-amd added 13 commits December 5, 2024 07:58

refactor deepseekv2

1286c09

edit args file

204333e

transformer rms_norm fix

0329081

attention layer, transformer config

3653c4f

layer specs

a5cfeaa

layer norm fix

c96952b

attention args

9f021b1

layer specs and attention fix

bf0a2cf

add get qkv tensors

fcdc539

forward method position id fix

2748ad0

import path modify

9a39087

fix

172e455

fix transformer config param

9767c4f

hakankiymaz-amd requested a review from lcskrishna December 10, 2024 18:32

lcskrishna requested a review from wenchenvincent December 11, 2024 02:50

lcskrishna reviewed Dec 11, 2024

View reviewed changes

megatron/core/transformer/transformer_layer.py Outdated Show resolved Hide resolved

wenchenvincent reviewed Dec 11, 2024

View reviewed changes

megatron/training/utils.py Outdated Show resolved Hide resolved

wenchenvincent reviewed Dec 11, 2024

View reviewed changes

megatron/core/models/deepseekv2/transformer_layer.py Outdated Show resolved Hide resolved

wenchenvincent reviewed Dec 11, 2024

View reviewed changes

megatron/core/models/deepseekv2/transformer_block.py Outdated Show resolved Hide resolved

hakankiymaz-amd added 7 commits December 11, 2024 11:50

update on transformers

5c195da

transformer block update

5b229b4

rename submodules

55fac7e

rms norm

0e9246f

attention submodules

1aa2d71

MLLA self attn for deepseekv2

012d8b2

modify dsv2 config

cbb3fb3

wenchenvincent reviewed Dec 17, 2024

View reviewed changes

examples/deepseek_v2/pretrain_deepseek.py Show resolved Hide resolved

wenchenvincent reviewed Dec 17, 2024

View reviewed changes

megatron/core/models/deepseekv2/model.py Show resolved Hide resolved

wenchenvincent reviewed Dec 17, 2024

View reviewed changes

megatron/training/utils.py Show resolved Hide resolved

add copyright statements

006398a

hakankiymaz-amd added 2 commits January 8, 2025 03:55

copyright

06f41ff

add TE for MLA

0f233d5

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Deepseek v2 16b enablement #34

Deepseek v2 16b enablement #34

hakankiymaz-amd commented Dec 10, 2024

wenchenvincent Dec 11, 2024

wenchenvincent commented Dec 17, 2024

hakankiymaz-amd commented Dec 18, 2024

Deepseek v2 16b enablement #34

Are you sure you want to change the base?

Deepseek v2 16b enablement #34

Conversation

hakankiymaz-amd commented Dec 10, 2024

wenchenvincent Dec 11, 2024

Choose a reason for hiding this comment

wenchenvincent commented Dec 17, 2024

hakankiymaz-amd commented Dec 18, 2024