vllm cannot load model after megatron training #1757

KAKSIS · 2025-05-29T10:04:49Z

After megatron training and convert to hf model, i want to infer using vllm, which meet problem when loading.
File "/python3.11/site-packages/vllm/model_executor/models/utils.py", line 250, in _load_module
raise ValueError(msg)
ValueError: There is no module or parameter named 'decoder' in Qwen3ForCausalLM
After model_merger.py process, the name of parameters changed.

ccclyu added the help wanted Extra attention is needed label May 29, 2025

ShareLer mentioned this issue May 30, 2025

[bugfix] fix megatron model merger #1774

Open

6 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

vllm cannot load model after megatron training #1757

vllm cannot load model after megatron training #1757

KAKSIS commented May 29, 2025

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

vllm cannot load model after megatron training #1757

vllm cannot load model after megatron training #1757

Comments

KAKSIS commented May 29, 2025

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.