Icon

NVIDIA NIM 免费使用满血DeepSeekV4、minimaxai等模型,附带Agent使用

软件推荐 江湖剑客 2026-06-25
资源介绍


介绍:

NVIDIA Build /NVIDIA NIM 的核心是 NIM——一套经过优化的、容器化的推理微服务。它将 AI 模型的部署复杂性抽象掉,提供标准化的 API 接口,让开发者可以在任何搭载 NVIDIA GPU 的系统上运行模型(云端、本地数据中心、RTX 工作站均可),保证一致的性能和可移植性。

模型列表:


大语言模型 / 推理模型


模型

发布者

亮点

DeepSeek V4 Pro

DeepSeek AI

1M token 上下文,MoE 架构,专注编程任务

DeepSeek V4 Flash

DeepSeek AI

284B MoE,1M 上下文,快速编码和 Agent

GLM-5.1

Z.ai

旗舰 LLM,Agent 工作流、编码、长时推理

Nemotron-3-Ultra-550B-A55B

NVIDIA

混合 Mamba-Transformer MoE,1M 上下文

Nemotron-3-Super-120B-A12B

NVIDIA

同架构缩小版,6000万下载量

Mistral Large 3 675B

Mistral AI

通用 MoE VLM,聊天/Agent/指令场景

Mistral Medium 3.5 128B

Mistral AI

文本生成、编码、Agent 场景

Mistral Small 4 119B

Mistral AI

混合 MoE,256K 上下文,多模态输入

Qwen 3.5 397B-A17B

Qwen

400B MoE VLM,视觉/聊天/RAG/Agent

Qwen 3.5 122B-A10B

Qwen

122B MoE,编码推理多模态

Kimi K2.6

Moonshot AI

1T 多模态 MoE,长时编码和工具调用

MiniMax M2.7

MiniMax

230B 参数,编码推理办公任务

MiniMax M3 Preview

MiniMax

多模态 MoE 视觉语言模型

Step-3.7 Flash

StepFun

稀疏 MoE,企业/Agent/编码

Step-3.5 Flash

StepFun

200B 开源推理引擎

Gemma 4 31B

Google

密集 31B,前沿推理和 Agent 工作流

DiffusionGemma 26B

Google

扩散式 LLM,并行 token 生成,实时文本应用

官网地址:Try NVIDIA NIM APIs

创建、登录账号后;推荐使用Cursor来使用API,Cursor的Agent可以快速将文件夹或文件来协助处理。

Cursor地址:https://cursor.com/referral?code=VFFYUGPKZCKC

1、创建API

点击创建并保存KEY即可



2、在Cursor增加API

image.png

3、增加配置如下

3-1 获取模型标题



3-2 输入模型标题以及KEY和NVIDIA NIM 的官方 API 端点: https://integrate.api.nvidia.com/v1

资源操作
前往下载
将跳转至进入云盘/官网下载!请知晓
作者信息
Avatar
江湖剑客

这位作者很懒,什么都没写~