Google Cloud I/O 大會 生成式 AI:
Vertex AI 中的新基礎模型、嵌入和調整工具

2023/05/15

本文編譯自:Google Blog

生成式 AI 創造了新一代數位助理、內容創建工具和應用程式,改變了應用程式的建構方式、誰可以建構它們以及最終用戶期望從它們獲得的功能。

Google 是該領域的領導者,從創建使生成式 AI 成為可能的Google Transformer 架構,到今天發布 PaLM 2,Google的下一代語言模型具有改進的多語言、推理和編碼功能。在 Google Cloud,致力於將這些變革性基礎模型的強大功能帶給客戶,並使開發人員能夠以全新的方式進行創新。

3 月份,Google在這一旅程中邁出了一大步,發布了兩個主要公告:Gen App Builder,它讓開發人員,即使是機器學習經驗有限的開發人員,也能快速輕鬆地創建生成式聊天和搜索應用程式;Vertex AI 中的 Generative AI 支援,擴展了Google的機器學習開發平台,訪問新Model Garden中的基礎模型和 API ,以及用於在Generative AI Studio中自定義和試驗模型的各種工具。

今天,在Google I/O 2023上,Google很高興在產品的基礎上發佈各種公告,讓客戶能夠訪問新的生成式模式以及利用並調整模型的擴展方式,包括:

 • Vertex AI 中提供三個新的基礎模型,可以透過 API 訪問以及Generative AI Studio 中的簡單 UI 進行調整,或部署到數據科學筆記本中。
  • Codey是文本到程式碼的基礎模型,可以嵌入到 SDK 或應用程式中,幫助提高開發人員生成程式碼和完成程式碼的速度,並提高程式碼品質。
  • Imagen是文本到圖像基礎模型,企業可以根據任何業務需求大規模生成和自定義專業圖像。
  • Chirp是語音到文本基礎模型,可幫助企業透過字幕和語音幫助以客戶的母語更深入、更包容地與客戶互動。
 • 用於文本和圖像的嵌入API,可幫助開發人員基於對文本或圖像的語義理解建構推薦引擎、分類器、問答系統和其他複雜的應用程式。
 • 人類反饋強化學習 (RLHF),透過讓企業結合人類反饋來定制和改進模型性能,從而擴展了 Vertex AI 的調整和提示設計能力。
 • Generative AI Studio、Model Garden 和 PaLM 2 for Text and Chat,正在從受信任的測試人員可用性轉變為預覽版,意味著擁有 Google Cloud 帳戶的每個人都可以訪問。

這些發佈是Google幫助開發人員大膽、負責任地使用生成式 AI 技術進行建構旅程的下一步,並以企業級安全、保障和隱私為後盾。

新的基礎模型為開發人員和數據科學家提供了更多建構生成式 AI 應用程式的能力

第一個新基礎模型是 Codey,透過即時程式碼完成和生成加速軟體開發,可根據客戶自己的程式碼資料庫進行定制。此程式碼生成模型支持 20 多種程式語言,包括 Go、Google Standard SQL、Java、Javascript、Python 和 Typescript。它支持各種編碼任務,透過以下方式幫助開發人員更快地工作並縮小技能差距:

 • 程式碼完成:Codey 根據輸入到提示中的程式碼上下文建議接下來的幾行。
 • 程式碼生成:根據開發人員的自然語言提示生成程式碼。
 • 程式碼聊天:Codey 讓開發人員可以與機器人交談,以獲得有關文件、學習新概念和其他程式碼相關問題的幫助。

第二個基礎模型是 Imagen,它允許客戶生成和編輯高品質圖像以滿足任何業務需求。這種文本到圖像模型可以大規模創建和編輯高品質圖像,並具有低延遲和企業級數據治理。借助 Vertex AI,使用者可以使用自己的內容(例如現有產品或Logo)生成圖像來定義和調整 Imagen 以滿足其業務需求。利用 300 多種語言的編輯、圖像放大和圖像字幕等強大功能,客戶可以快速生成可用於生產的圖像。

借助 Vertex AI 上的 Imagen,只要輸入幾個關鍵詞作為提示即可創建出專業級別的圖像,而修改圖像,只需要再輸入相關關鍵詞,例如更改顏色,即可進行圖像修改。Imagen 還包括使用完美描述對圖像進行說明和分類的功能,並且內容審核得到安全最佳實踐的支援。此外,在 Vertex AI 上生成的任何圖像都是客戶的數據,企業可以將其用於行銷宣傳材料等用途。

要生成產品的新圖像,企業可以上傳現有圖像,並使用 Vertex AI 中內建的安全和治理控制來確保數據安全。生成的圖像可以無限疊加,放大到所需的像素,並輕鬆地使用標題和數據源進行擴充。

第三個基礎模型是 Chirp,幫助企業以更具包容性的語言與客戶互動。無論是用西班牙語連接聯絡中心的虛擬座席,或是用科薩語為影像添加字幕,還是用巴厘島語提供語音幫助,Chirp 都將大型模型的強大功能用於從語音控制到字幕再到語音協助的語音任務。

Chirp 經過數百萬小時的語音訓練,是Google 20 億參數語音模型的一個版本,它支持 100 多種語言,並將世界上使用最廣泛的語言的模型品質帶到其他語言和方言中。Chirp 在英語上實現了 98% 的準確率,在使用人數少於 1000 萬的語言上相對提高了 300%。

Embeddings API:尋找數據中的新關係並推動複雜的生成式 AI 應用程式

Vertex AI 現已提供用於文本和圖像的嵌入 API,讓開發人員可以建立更具吸引力的應用程式和使用者體驗。嵌入將文本和圖像數據轉換為映射語義關係的多維數值向量,可以由大型模型處理,並且對於較長的文字輸入特別有用,例如具有數千個標記的文本。

嵌入 API 在 Vertex AI 中可用,透過建構強大的語義搜索和文本分類功能、基於企業數據創建問答式聊天機器人以及改進集群、異常檢測、情緒分析等,開發人員可以創建更具吸引力的應用程式和使用者體驗。

用於文本的嵌入 API 在預覽版中可用,受信任的測試人員可以利用於文本和圖像的 API。

使用 RLHF 從基礎模型中獲得更多價值

Vertex AI 是超大規模企業中第一個將 RLHF 作為託管服務提供的端到端機器學習平台,可幫助企業隨著時間的推移,高效地維護模型性能,並將更安全、更準確和更有用的模型部署到生產中。

這種獨特的調整功能使企業能夠結合使用者反饋來訓練可用於微調基礎模型的獎勵模型。在準確性至關重要的行業(例如醫療保健)或客戶滿意度至關重要(例如金融和電子商務)中特別有用,最終會帶來更高的客戶滿意度和參與度。還可以讓使用者更準確地審查模型對偏差、有毒內容或其他維度的反應,教導模型避免不適當的輸出。

開始建設

憑藉Google在 Vertex AI 中提供的新基礎模型以及用於自定義和利用這些模型的擴展工具集,Google將繼續轉變所有行業和技術專業水準的企業在雲端中建構以及與 AI 互動的方式。

Codey、Imagen、Embeddings API for images 和 RLHF 可透過受信任的測試程式在 Vertex AI 中使用,而 Chirp、PaLM 2、Embeddings API 和 Generative AI Studio for text 可在 Vertex AI 中以預覽形式提供給使用 Google Cloud 的每個帳戶。

Google期待與客戶繼續這段激動人心的旅程,要了解迄今為止的客戶對話,並了解來自 Google 和 Google Cloud 的所有最新 AI 新聞,請務必查看關於 Transform with Google提示雲