· 把 LLM 当嘴,把 Python 当脑 ·
v2 · 经代理独立审查后迭代
在原训练引导(7 阶段话术模型)的基础上,把模型包装成能独立完成销售转化的后端服务。
模型只负责「说得像」,其他一切靠外层系统:prompt 动态拼接、intent 分类、滚动记忆、兜底规则、合规脱敏。
4 档位 方案(入门/中阶/高阶/随缘)1304 条扩到 1500+ 条sft_lora.yaml 配置:Qwen2.5-7B + quantization_bit=4 + lora_rank=64 + epochs=3http://100.126.170.50:8000/v1app.py:接入微调模型的 vLLM endpointsystem prompt 动态拼接器(注入当前轮次、产品档位、客户画像){"intent": "...", "confidence": 0.X}