部署价值190万的昇腾910B1 - 8卡64G服务器部署QWen3-235B

分类：AI | 2025-09-03 17:09:18

体验价值190万的昇腾910B1 - 8卡64G服务器部署QWen3-235B:
内存: 1.5T

cpu: 192核

显存: 8卡64G

价格: 180~190 W

用了几天时间, 基本部署好了, 32B 与 235B 的qwen模型用起来还是很流畅的

写个脚本试用一下:

from openai import OpenAI
client = OpenAI(
    api_key="测试",
    base_url="http://localhost:1025/v1/"
)

def send_message_to_bot(message):
    response = client.chat.completions.create(
        messages=[
            {'role': 'user', 'content': message},
        ],
        model='qwen3',  # 调用的模型
        stream=True  # True 是流式返回，False是非流式返回
    )

    for chunk in response:
        print(chunk.choices[0].delta.content, end="", flush=True)


print("开始与AI聊天 (输入'exit'退出)")
while True:
    user_input = input("你: ")
    if user_input.lower() == 'exit':
        break
    print("AI: ", send_message_to_bot(user_input))