部署价值190万的昇腾910B1 - 8卡64G服务器部署QWen3-235B

分类:AI |

体验价值190万的昇腾910B1 - 8卡64G服务器部署QWen3-235B: 
内存: 1.5T 

cpu: 192核

显存: 8卡64G

价格: 180~190 W

用了几天时间, 基本部署好了, 32B 与 235B 的qwen模型 用起来还是很流畅的


image.png


写个脚本试用一下: 


from openai import OpenAI
client = OpenAI(
    api_key="测试",
    base_url="http://localhost:1025/v1/"
)

def send_message_to_bot(message):
    response = client.chat.completions.create(
        messages=[
            {'role': 'user', 'content': message},
        ],
        model='qwen3',  # 调用的模型
        stream=True  # True 是流式返回,False是非流式返回
    )

    for chunk in response:
        print(chunk.choices[0].delta.content, end="", flush=True)


print("开始与AI聊天 (输入'exit'退出)")
while True:
    user_input = input("你: ")
    if user_input.lower() == 'exit':
        break
    print("AI: ", send_message_to_bot(user_input))



AI
阅读( 26 ) |