輝達小型語言模型讓數位人類更聽話

這款名為Nemotron-4 4B Instruct的模型，提供了更好的角色扮演、檢索增強生成和功能調用能力，能使遊戲角色更直接地理解玩家指令、回應玩家並執行更精確相關的動作。

編譯／莊閔棻

輝達在今年的科隆遊戲展（Gamescom）上宣布，其數位人類技術套件「ACE」現已包含首款由RTX AI 裝置端運行的小型語言模型（SLM），這款名為Nemotron-4 4B Instruct的模型，提供了更好的角色扮演、檢索增強生成和功能調用能力，能使遊戲角色更直接地理解玩家指令、回應玩家並執行更精確相關的動作。

據報導，該模型作為輝達NIM 微服務的一部分，能支援遊戲開發者透過雲端和自己的設備部署，並優化了低記憶體使用量，提供更快的回應速度，讓開發者能更好地利用GeForce RTX 遊戲電腦和筆記型電腦，以及輝達RTX 工作站。

更多新聞：比國家氣象總署還準輝達推新 AI 模型

小型語言模型的優勢

一般來說，AI 模型的準確性和性能取決於訓練數據集的大小和品質，大型語言模型（LLM）通常涵蓋大量數據，但往往會包含過多的無關資訊，而小型語言模型（SLM）則專注於特定用途，即使數據量較少，也能更快速地提供更準確的回應，這在與數位人類進行自然對話時非常重要。

而Nemotron-4 4B 則是從更大的 Nemotron-4 15B LLM 濃縮而來，這一過程讓較小的模型能模仿較大模型的輸出，同時移除不必要的部分，以縮小模型參數，隨後，該模型再進行量化處理，降低了權重的精度。

藉由更少的參數，Nemotron-4 4B用更小的記憶體，能提供更快的首次回應時間，同時仍保持高度準確度，其小型化特點，使整合了NIM微服務的遊戲和應用程式，能在更多消費者現有的 GeForce RTX AI 電腦和筆記型電腦，及輝達RTX AI 工作站上本地運行。

ACE 的應用前景

ACE允許開發者通過雲端或 RTX AI 電腦和工作站，部署尖端的生成式 AI 模型，為遊戲和應用帶來 AI 技術，借助 ACE，非玩家角色（NPC）可以在遊戲中，與玩家進行動態互動和即時對話。

ACE 包含了關鍵的 AI 模型，如語音轉文字、語言模型、文字轉語音和面部動畫等，其模組化設計，使開發者可以根據需求，選擇所需的 NIM 微服務，輝達Riva自動語音識別（ASR）技術，可將用戶語音轉換為高精確度的即時文本，並支援多語言語音和翻譯微服務。

接著，經過轉錄後的文本可透過 LLM（如 Google 的 Gemma、Meta 的 Llama 3 或 Nemotron-4 4B）生成回應，然後再透過 Riva 的文字轉語音技術，生成音頻回應，最後，輝達的 Audio2Face 技術，則能生成與多語言對話同步的面部表情，實現生動的數位人類互動。

ACE 不僅支援多種輝達和第三方 AI 模型，還允許開發者根據體驗、工作負載和成本，在雲端或本地設備上進行混合推理，現在ACE NIM 微服務已在多個遊戲和技術展示中應用，包括 Covert Protocol 和 Mecha BREAK 等。