NVIDIA NIM 免费使用满血DeepSeekV4、minimaxai等模型，附带Agent使用

软件推荐江湖剑客 2026-06-25

资源介绍

介绍：

NVIDIA Build /NVIDIA NIM 的核心是 NIM——一套经过优化的、容器化的推理微服务。它将 AI 模型的部署复杂性抽象掉，提供标准化的 API 接口，让开发者可以在任何搭载 NVIDIA GPU 的系统上运行模型（云端、本地数据中心、RTX 工作站均可），保证一致的性能和可移植性。

模型列表：

大语言模型 / 推理模型

模型

发布者

亮点

DeepSeek V4 Pro

DeepSeek AI

1M token 上下文，MoE 架构，专注编程任务

DeepSeek V4 Flash

DeepSeek AI

284B MoE，1M 上下文，快速编码和 Agent

GLM-5.1

Z.ai

旗舰 LLM，Agent 工作流、编码、长时推理

Nemotron-3-Ultra-550B-A55B

NVIDIA

混合 Mamba-Transformer MoE，1M 上下文

Nemotron-3-Super-120B-A12B

NVIDIA

同架构缩小版，6000万下载量

Mistral Large 3 675B

Mistral AI

通用 MoE VLM，聊天/Agent/指令场景

Mistral Medium 3.5 128B

Mistral AI

文本生成、编码、Agent 场景

Mistral Small 4 119B

Mistral AI

混合 MoE，256K 上下文，多模态输入

Qwen 3.5 397B-A17B

Qwen

400B MoE VLM，视觉/聊天/RAG/Agent

Qwen 3.5 122B-A10B

Qwen

122B MoE，编码推理多模态

Kimi K2.6

Moonshot AI

1T 多模态 MoE，长时编码和工具调用

MiniMax M2.7

MiniMax

230B 参数，编码推理办公任务

MiniMax M3 Preview

MiniMax

多模态 MoE 视觉语言模型

Step-3.7 Flash

StepFun

稀疏 MoE，企业/Agent/编码

Step-3.5 Flash

StepFun

200B 开源推理引擎

Gemma 4 31B

Google

密集 31B，前沿推理和 Agent 工作流

DiffusionGemma 26B

Google

扩散式 LLM，并行 token 生成，实时文本应用

官网地址：Try NVIDIA NIM APIs

创建、登录账号后；推荐使用Cursor来使用API，Cursor的Agent可以快速将文件夹或文件来协助处理。

Cursor地址：https://cursor.com/referral?code=VFFYUGPKZCKC

1、创建API

点击创建并保存KEY即可

2、在Cursor增加API

3、增加配置如下

3-1 获取模型标题

3-2 输入模型标题以及KEY和NVIDIA NIM 的官方 API 端点： https://integrate.api.nvidia.com/v1

返回上一页

资源操作

前往下载

将跳转至进入云盘/官网下载!请知晓

作者信息

江湖剑客

这位作者很懒，什么都没写~