「OpenAl 設計的插件系統是我這輩子見過的最瘋狂的系統。如果你要給它寫插件,你并不是去寫這個插件的程序,你是寫一個關于插件的描述,用你的自然語言,然后 GPT 來幫你生成這個插件。」
十年前,當一個人躍躍欲試要給新發布的 iPhone 寫APP 的時候,ta必須自己是個非常老練的程序員才行。今天,當你躍躍欲試要給新發布的 GPT 平臺寫插件,你只要用自然語言描述你希望實現的效果就行了。
OpenAI發布了ChatGPT的插件支持,這些插件是專為語言模型設計的工具,以安全性為核心原則。插件可以幫助ChatGPT訪問最新信息、進行計算或使用第三方服務。
(資料圖片)
插件可以作為語言模型的“眼睛和耳朵”,讓它們訪問實時、個性化或特定的信息。同時,插件也可以讓語言模型在用戶明確請求下執行安全、受限的操作,從而提高系統的整體實用性。
我們在 ChatGPT 中實現了插件的初始支持。插件是專門為語言模型設計的工具,安全是其核心原則,幫助 ChatGPT 訪問最新的信息、運行計算或使用第三方服務。
根據我們的迭代部署哲學,我們正在ChatGPT中逐步推出插件,以便我們可以研究它們的實際使用、影響以及安全和對齊挑戰——這些都是我們必須正確處理才能實現我們的使命的。自從我們推出ChatGPT以來,用戶一直在要求插件(許多開發人員正在嘗試類似的想法),因為它們解鎖了廣泛的可能用例。我們從一小部分用戶開始,計劃在學到更多知識后逐步推出規模更大的訪問(針對插件開發人員、ChatGPT用戶以及經過Alpha測試后希望將插件集成到其產品中的API用戶)。我們很高興建立一個社區,塑造人類與AI交互范式的未來。已被邀請離開我們的等待列表的插件開發人員可以使用我們的文檔來為ChatGPT構建插件,然后在向語言模型顯示的提示中列出啟用的插件,以及指導模型如何使用每個插件的文檔。第一個插件由Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram和Zapier創建。
我們還自己托管了兩個插件,一個網頁瀏覽器和一個代碼解釋器。我們還開源了一個知識庫檢索插件的代碼檢索插件,可以由任何希望增強ChatGPT信息的開發人員進行自我托管。
今天,我們將開始向我們的等待列表中的用戶和開發人員擴展插件alpha訪問。雖然我們最初會優先考慮少數開發人員和ChatGPT Plus用戶,但我們計劃隨著時間的推移推出更大規模的訪問。
將語言模型連接到外部工具引入了新的機會,同時也帶來了顯著的風險。
插件提供了解決與大型語言模型相關的各種挑戰的潛力,包括“幻想”、“跟上最新事件”的問題以及訪問(經過許可的)專有信息來源。通過將明確的訪問外部數據集成到語言模型中,例如最新的在線信息、基于代碼的計算或自定義的插件檢索信息,語言模型可以通過基于證據的參考加強其響應。
這些參考不僅增強了模型的效用,還使用戶能夠評估模型輸出的可信度并雙重檢查其準確性,潛在地緩解了與過度依賴相關的風險,正如我們最近的GPT-4系統卡中所討論的那樣。最后,插件的價值可能遠不止于解決現有限制問題,還可幫助用戶應對各種新用例,從瀏覽產品目錄到預訂航班或訂購食品等。
同時,插件可能會增加安全挑戰,采取有害或意外的行動,增加壞人欺詐、誤導或濫用他人的能力。通過增加可能的應用范圍,插件可能會增加模型在新領域中采取的錯誤或不對齊操作的負面后果的風險。從第一天開始,這些因素就指導著我們插件平臺的開發,并實施了幾項保障措施。
從第一天開始,這些因素就指導著我們插件平臺的開發,并實施了幾項保障措施。
我們進行了紅色團隊演習,既在內部進行,也與外部合作伙伴進行,發現了許多可能存在的令人擔憂的情況。例如,我們的紅色團隊發現如果插件沒有保障就會執行復雜的提示注入、發送欺詐和垃圾郵件、繞過安全限制或濫用發送到插件的信息。我們正在使用這些發現來制定安全設計減輕風險的措施,以限制插件風險行為并改善其在用戶體驗中的操作方式和時間。我們還使用這些發現來指導我們逐步部署插件訪問的決策。
如果您是一位對研究這一領域的安全風險或減輕措施感興趣的研究人員,我們鼓勵您利用我們的研究人員接入計劃。我們還邀請開發人員和研究人員作為我們最近開源的Evals框架的一部分提交插件相關的安全和能力評估。
插件可能會產生廣泛的社會影響。例如,我們最近發布的工作論文發現,具有工具訪問能力的語言模型可能比沒有此能力的模型具有更大的經濟影響力,更一般地,與其他研究人員的發現一致,我們預計當前AI技術的浪潮將對工作變革、轉移和創造的速度產生巨大影響。我們渴望與外部研究人員和我們的客戶合作研究這些影響。
一種實驗性模型,能夠知道何時以及如何瀏覽互聯網
受過去的工作的啟發允許語言模型嚴格從互聯網上讀取信息擴大了他們可以討論的內容量,超越了訓練語料庫,獲得來自當下的新鮮信息。
以下是瀏覽為ChatGPT用戶打開的體驗類型的示例,以前模型會禮貌地指出其訓練數據不包含足夠的信息以讓其回答。在這個示例中,ChatGPT檢索有關最新奧斯卡獎的最新信息,然后執行現在熟悉的ChatGPT詩歌壯舉,這是瀏覽可以是一種增量體驗的方式之一。
除了為最終用戶提供明顯的效用外,我們認為使語言和聊天模型進行徹底和可解釋的研究對于可擴展的對齊具有令人興奮的前景。
我們創建了一個網絡瀏覽插件,使語言模型能夠訪問網絡瀏覽器,其設計優先考慮安全和成為網絡的良好公民。插件的基于文本的網絡瀏覽器僅限于進行GET請求,這減少了(但并未消除)某些類別的安全風險。這將瀏覽插件的范圍限定為有用于檢索信息,但排除了具有更多安全問題和安全問題可能性更大的“事務性”操作,如表單提交等。
瀏覽使用Bing搜索API從網絡檢索內容。因此,我們從Microsoft繼承了大量工作,包括(1)信息來源的可靠性和真實性以及(2)“安全模式”以防止檢索問題內容。該插件在一個隔離的服務中運行,因此ChatGPT的瀏覽活動與我們基礎架構的其余部分分離。
為了尊重內容創作者并遵守網絡規范,我們的瀏覽器插件的用戶代理標記為[ChatGPT-User](https://openai.com/bot),并配置為遵守網站的robots.txt文件。這可能偶爾會導致“點擊失敗”消息,這表示插件正在遵守網站的指令,以避免爬取它。此用戶代理僅用于代表ChatGPT用戶采取直接行動,不用于以任何自動方式爬取網絡。我們還發布了我們的IP出口范圍。此外,已實施速率限制措施,以避免向網站發送過多流量。
我們的瀏覽插件可以顯示訪問的網站并在 ChatGPT 的回答中引用其來源。這種額外的透明度層幫助用戶驗證模型回答的準確性,同時也向內容創作者歸功。我們感謝這是一種與網絡互動的新方法,并歡迎有關如何將流量帶回來源并增加生態系統整體健康的反饋。
開源檢索插件使ChatGPT能夠訪問個人或組織信息源(需獲得許可)。它允許用戶通過使用自然語言提出問題或表達需求,從其數據源(例如文件、筆記、電子郵件或公共文檔)獲取最相關的文檔片段。
作為一種開源且自托管的解決方案,開發人員可以部署自己的插件版本,并將其注冊到ChatGPT中。該插件利用OpenAI嵌入,并允許開發人員選擇一個向量數據庫(Milvus、Pinecone、Qdrant、Redis、Weaviate或Zilliz)來索引和搜索文檔。信息源可以使用Webhook與數據庫同步。
要開始使用,請訪問檢索插件存儲庫。
關鍵詞: