NVIDIA NIM 免费使用满血DeepSeekV4、minimaxai等模型,附带Agent使用
软件推荐
江湖剑客
2026-06-25
资源介绍

介绍:
NVIDIA Build /NVIDIA NIM 的核心是 NIM——一套经过优化的、容器化的推理微服务。它将 AI 模型的部署复杂性抽象掉,提供标准化的 API 接口,让开发者可以在任何搭载 NVIDIA GPU 的系统上运行模型(云端、本地数据中心、RTX 工作站均可),保证一致的性能和可移植性。
模型列表:

大语言模型 / 推理模型
模型
发布者
亮点
DeepSeek V4 Pro
DeepSeek AI
1M token 上下文,MoE 架构,专注编程任务
DeepSeek V4 Flash
DeepSeek AI
284B MoE,1M 上下文,快速编码和 Agent
GLM-5.1
Z.ai
旗舰 LLM,Agent 工作流、编码、长时推理
Nemotron-3-Ultra-550B-A55B
NVIDIA
混合 Mamba-Transformer MoE,1M 上下文
Nemotron-3-Super-120B-A12B
NVIDIA
同架构缩小版,6000万下载量
Mistral Large 3 675B
Mistral AI
通用 MoE VLM,聊天/Agent/指令场景
Mistral Medium 3.5 128B
Mistral AI
文本生成、编码、Agent 场景
Mistral Small 4 119B
Mistral AI
混合 MoE,256K 上下文,多模态输入
Qwen 3.5 397B-A17B
Qwen
400B MoE VLM,视觉/聊天/RAG/Agent
Qwen 3.5 122B-A10B
Qwen
122B MoE,编码推理多模态
Kimi K2.6
Moonshot AI
1T 多模态 MoE,长时编码和工具调用
MiniMax M2.7
MiniMax
230B 参数,编码推理办公任务
MiniMax M3 Preview
MiniMax
多模态 MoE 视觉语言模型
Step-3.7 Flash
StepFun
稀疏 MoE,企业/Agent/编码
Step-3.5 Flash
StepFun
200B 开源推理引擎
Gemma 4 31B
密集 31B,前沿推理和 Agent 工作流
DiffusionGemma 26B
扩散式 LLM,并行 token 生成,实时文本应用
官网地址:Try NVIDIA NIM APIs
创建、登录账号后;推荐使用Cursor来使用API,Cursor的Agent可以快速将文件夹或文件来协助处理。
Cursor地址:https://cursor.com/referral?code=VFFYUGPKZCKC
1、创建API
点击创建并保存KEY即可

2、在Cursor增加API

3、增加配置如下
3-1 获取模型标题

3-2 输入模型标题以及KEY和NVIDIA NIM 的官方 API 端点: https://integrate.api.nvidia.com/v1
作者信息
江湖剑客
这位作者很懒,什么都没写~