Tag: Qwen3
All the articles with the tag "Qwen3".
-
Qwen3 推理全流程解析:基于 vLLM 源码的逐层拆解
基于 vLLM v0.20.1 中 qwen3.py 和 qwen2.py 的源码实现,从 Embedding、QK-Norm、RoPE、SwiGLU 到 LM Head,逐层拆解 Qwen3 的端到端推理计算流程,并对比与 Qwen2 的关键架构差异。
All the articles with the tag "Qwen3".
基于 vLLM v0.20.1 中 qwen3.py 和 qwen2.py 的源码实现,从 Embedding、QK-Norm、RoPE、SwiGLU 到 LM Head,逐层拆解 Qwen3 的端到端推理计算流程,并对比与 Qwen2 的关键架构差异。