部署价值190万的昇腾910B1 - 8卡64G服务器部署QWen3-235B
体验价值190万的昇腾910B1 - 8卡64G服务器部署QWen3-235B: 
内存: 1.5T 
cpu: 192核
显存: 8卡64G
价格: 180~190 W
用了几天时间, 基本部署好了, 32B 与 235B 的qwen模型 用起来还是很流畅的

写个脚本试用一下:
from openai import OpenAI
client = OpenAI(
    api_key="测试",
    base_url="http://localhost:1025/v1/"
)
def send_message_to_bot(message):
    response = client.chat.completions.create(
        messages=[
            {'role': 'user', 'content': message},
        ],
        model='qwen3',  # 调用的模型
        stream=True  # True 是流式返回,False是非流式返回
    )
    for chunk in response:
        print(chunk.choices[0].delta.content, end="", flush=True)
print("开始与AI聊天 (输入'exit'退出)")
while True:
    user_input = input("你: ")
    if user_input.lower() == 'exit':
        break
    print("AI: ", send_message_to_bot(user_input))