就在今天凌晨,OpenAI 馬不停蹄地又雙叒叕更新啦!
這一次,不僅重磅升級了 ChatGPT 背后的 GPT-3.5-turbo?模型、以及最先進的 GPT-4 文本生成模型,而且大幅降低了價格,另外還為 gpt-3.5-turbo 提供 16000 個 Token 的語境窗口(Context Window)上下文選項。

一、更新速覽
詳細來看,在今天的更新中,OpenAI 主要聚焦在下面幾個維度:
全新的 16k 上下文 GPT-3.5-Turbo 模型版本(今天向所有人提供)
升級版的 GPT-4?和?GPT-3.5-Turbo 模型
Chat Completions?API 中的新函數調用功能
最先進的 V2 嵌入模型降價 75%
gpt-3.5-turbo?的輸入 Token 成本降低 25%
宣布?gpt-3.5-turbo-0301?和?gpt-4-0314?模型的淘汰時間表
GPT-4 的 API 權限將開放給更多的人
值得一提的是,OpenAI 再次重申,所有這些模型都具備 OpenAI 在 3 月 1 日推出的數據隱私和安全保證--用戶從他們的請求中產生的所有輸出,以及 API 數據都不會被用于訓練。
據 OpenAI 公告顯示,最新的 gpt-4-0613 版本包括一個帶函數調用的更新和改進的模型。
gpt-4-32k-0613 包括與 gpt-4-0613 相同的改進,同時擴展了上下文長度,以便更好地理解更大的文本。
有了這些更新,在未來幾周內,OpenAI 表示將會邀請更多候補名單上的人試用 GPT-4,目的是通過這個模型完全取消等待名單。
三、GPT-3.5-turbo-16k? 大更新
事實上,在大型語言模型(LLMs)中,"語境窗口"(Context Window)就像一個短期存儲器,存儲著提示輸入的內容,或者在聊天機器人的情況下,存儲著正在進行的對話的全部內容。在語言模型中,增加語境大小已經成為一場技術競賽,Anthropic 最近宣布為其 Claude 語言模型提供 75000?個語境窗口選項。此外,OpenAI 已經開發了一個 32,000?個 Token 的 GPT-4 版本,但它還沒有公開提供。
在今天的最新更新中,OpenAI 推出了 gpt-3.5-turbo 的新的 16000 個上下文語境窗口版本,官方名稱叫做:gpt-3.5-turbo-16k,允許一個提示的長度達到 16000 個 Token。
來源:https://twitter.com/minchoi/status/1668738225567875072
由于它提供了 4 倍于 gpt-3.5-turbo 的上下文長度,這意味著 gpt-3.5-turbo-16k 模型現在可以在一次請求中支持 20 頁的文本。
這對于需要模型處理和生成較大塊文本響應的開發者來說是一個相當大的提升。
不過,想要廣泛使用還需要再等一等。

再者,gpt-3.5-turbo-0613 版本與 GPT-4 一樣有著函數調用功能,以及通過系統消息提供的更可靠的可引導性,這兩個特性使開發者能夠更有效地引導模型的響應。
四、函數調用支持新版 GPT-4 和 GPT-3.5
要論最最最為重磅的更新,便是開發者現在可以向 gpt-4-0613 和 gpt-3.5-turbo-0613 描述函數,并讓模型智能地選擇輸出一個包含參數的 JSON 對象來調用這些函數。
這是一種全新的方式,開發者可以更可靠地將 GPT 的能力與外部工具和 API 連接起來。
簡單來看,OpenAI 聯合創始人Greg Brockman 解釋道,這是插件的底層機制,允許開發者與自己的工具集成起來:

那該具體怎么用?
OpenAI 舉了三個例子,其表示,這些模型已經過微調,既可以檢測到何時需要調用一個函數(取決于用戶的輸入),又可以用符合函數簽名的 JSON 來響應。函數調用允許開發人員更可靠地從模型中獲得結構化的數據。
例如,開發人員可以:
創建聊天機器人,通過調用外部工具(例如,像 ChatGPT 插件)來回答問題
將諸如 "給 Anya 發郵件,看她下周五是否想喝咖啡 "這樣的查詢轉換為send_email(to: string, body: string)這樣的函數調用。
或者將 "波士頓的天氣如何?"轉換為 get_current_weather(location: string, unit: 'celsius' | 'fahrenheit')。
將自然語言轉換為 API 調用或數據庫查詢
將 "誰是我這個月的十大客戶?"轉換為內部 API 調用,如 get_customers_by_revenue(start_date: string, end_date: string, limit: int)。
或將 "Acme, Inc.上個月有多少訂單?"轉換成 SQL 查詢,使用sql_query(query: string)。
從文本中提取結構化數據
定義一個名為 extract_people_data(people: [{name: string, birthday: string, location: string}] 的函數,以提取維基百科文章中提到的所有人物。
這些用例是由 OpenAI 的? /v1/chat/completions 端點中的新 API 參數 functions 和 function_call 促成的,它允許開發者通過 JSON Schema 向模型描述功能,并可選擇要求它調用一個特定的功能。
1000.jpg
如果,現在你有 GPT-4 訪問權限,那么這些模型可以用函數調用功能。

五、舊模型即將廢棄
今天,OpenAI 將開始對 3 月份宣布的 gpt-4 和 gpt-3.5-turbo 的初始版本進行升級和廢棄處理。使用穩定模型名稱(gpt-3.5-turbo、gpt-4 和 gpt-4-32k)的應用程序將在 6 月 27 日自動升級到上面列出的新模型。
為了比較不同版本的模型性能,OpenAI 還提供開源的 Evals 庫(https://github.com/openai/evals)支持公共和私人評估 LLM,幫助開發者評測模型的變化將如何影響你的用例。
當然,對于需要更多時間過渡的開發者,OpenAI 也表示,可以繼續使用舊的模型。這些舊型號將在 9 月 13 日之后,徹底棄用。
六、加量不加價,即日起生效
除了以上功能更新之外,OpenAI 宣布下調價格,即日起生效。
首先,對于?OpenAI 最受歡迎的嵌入模型——text-embedding-ada-002,OpenAI 將成本降低 75%,至每 1K Token 是 0.0001 美元。
其次,對于最受歡迎的聊天模型——GPT-3.5 Turbo,OpenAI 將輸入 Token 的成本直降 25%,現在每 1K 輸入 Token 只需 0.0015 美元,每 1K 輸出 token 只需 0.002 美元,這相當于 1 美元大約有 700 頁的文本。
再者,最新推出的 gpt-3.5-turbo-16k 的價格是每 1K 輸入 token 是 0.003 美元,每 1K 輸出 Token 為 0.004 美元。
OpenAI 表示,降低成本是通過提高其系統的效率來實現的。毫無疑問,這是初創公司關注的關鍵領域,因為它在研發和基礎設施上花費了數億美元。
七、一騎絕塵的 OpenAI
OpenAI 已經表示,在 4 月初 GPT-4 發布之后,會對現有模型的增量更新,而不是大規模的從頭開始的新模型開發。在最近由《經濟時報》主辦的一次會議上,OpenAI CEO ?Sam Altman 也重申過,OpenAI 尚未開始培訓 GPT-4 的繼任者,這也側面意味著該公司在開始新模型之前“還有很多工作要做”。如今便是維護已發布模型的一大進步。
當然,這一進步也受到了不少網友的點贊:

當然,OpenAI 的快跑也給做大模型的同行帶來了巨大的壓力,有網友評論道:

對此,你最看好哪個更新?最新的 GPT-4 和 GPT-3.5-turbo 模型,還是 16k context turbo 模型?