部署价值190万的昇腾910B1 - 8卡64G服务器部署QWen3-235B
体验价值190万的昇腾910B1 - 8卡64G服务器部署QWen3-235B:
内存: 1.5T
cpu: 192核
显存: 8卡64G
价格: 180~190 W
用了几天时间, 基本部署好了, 32B 与 235B 的qwen模型 用起来还是很流畅的

写个脚本试用一下:
from openai import OpenAI
client = OpenAI(
api_key="测试",
base_url="http://localhost:1025/v1/"
)
def send_message_to_bot(message):
response = client.chat.completions.create(
messages=[
{'role': 'user', 'content': message},
],
model='qwen3', # 调用的模型
stream=True # True 是流式返回,False是非流式返回
)
for chunk in response:
print(chunk.choices[0].delta.content, end="", flush=True)
print("开始与AI聊天 (输入'exit'退出)")
while True:
user_input = input("你: ")
if user_input.lower() == 'exit':
break
print("AI: ", send_message_to_bot(user_input))