2026年5月4日·#Tokenizer#LLM#NLP从 BPE 到 Unigram:一文讲清主流分词器系统梳理 BPE、Byte-level BPE、WordPiece 与 Unigram LM 的核心思想、训练流程、推理差异、典型场景与工程优化。阅读全文
2026年4月28日·#DeepSeek#LLM#部署8×H20 服务器部署 DeepSeek-V4-Flash 踩坑实录记录在 8×NVIDIA H20 (768GB 显存) 服务器上尝试部署 DeepSeek-V4-Flash 的完整过程,包括 SGLang、vLLM 的兼容性问题和最终结论。阅读全文