人工智慧已經經歷了多次炒作週期,但即使對懷疑論者來說,ChatGPT 的發布似乎也標誌著一個轉折點。OpenAI 的聊天機器人由其最新的大型語言模型提供支持,可以寫詩、講笑話,並撰寫看起來像人類創作的文章。

上次生成式人工智慧如此引人注目時,突破是在電腦視覺領域。自拍變成了文藝復興風格的肖像,社交媒體上充斥著過早衰老的面孔。五年後,自然語言處理的飛躍,以及大型語言模型重複幾乎任何主題的能力,抓住了大眾的想像。而且不僅僅是語言:生成模型還可以學習軟體程式碼、分子、自然圖像和各種其他資料類型的語法。

這項技術的應用每天都在成長,我們才剛開始探索其可能性。在 Tenten AI Studio,我們致力於幫助客戶使用生成模型更快地編寫高品質軟體程式碼、發現並訓練基於企業資料的值得信賴的對話聊天機器人。我們甚至使用生成式人工智慧來幫客戶做數據分析,以建立更強大、更值得信賴的 AI 模型,並取代受隱私和版權法保護的真實數據。

隨著這個領域的不斷發展,我們認為我們應該退後一步,解釋一下生成式人工智慧的含義、我們是如何走到這一步的,以及了解這些 AI 模型是如何運作的。

生成式 AI 的定義

生成式人工智慧(簡稱生成式 AI)是指那些能創建全新內容和構思的AI技術,這包括生成對話、故事、圖像、視頻和音樂等。這類 AI 技術旨在模擬人類在非計算傳統任務上的智能,比如圖像辨識、自然語言處理(NLP)和語言翻譯。生成式 AI 是AI發展的新階段,它能夠學習人類的語言、編程語言、藝術、化學、生物學等多種複雜的領域。生成式 AI 通過重復利用訓練資料來解答新問題。例如,它可以學習英文詞彙,然後創作出一首詩。企業可以將生成式 AI 運用於多種領域,如聊天機器人、媒體創作,以及產品開發和設計。

生成式 AI 為何重要?

像 ChatGPT 這樣的生成式 AI 程式引起了廣泛的關注,它們激發了人們的創造力。這些程式有助於重新塑造大多數客戶體驗和應用程式,創建前所未有的新應用,並幫助用戶達到新的工作效率水平。

據高盛預測,生成式 AI 可促進全球國內生產總值(GDP)增長7%(約7萬億美元)。他們還預計,生成式 AI 可在10年內將生產力增長率提高1.5%。

以下將介紹生成式 AI 的更多優勢。

加快研究進程

生成式 AI 算法能以新方式探索和分析複雜資料,幫助研究人員發現新趨勢和模式。這些算法能彙總內容,提出多種解決方案,促進創意思維,並根據研究筆記創建詳細文件,從而極大地增強研究和創新能力。

比如在製藥行業,生成式 AI 系統被用來產生和優化蛋白質序列,大幅加快藥物研發進程。

提升客戶體驗

生成式 AI 能夠自然回應人類對話,作為客戶服務和工作流程個性化工具。

AI 助手、語音機器人和虛擬助手可以更精確地回應客戶需求,提高客戶參與度並在首次接觸時解決問題。

優化業務流程

企業可以利用生成式 AI、機器學習(ML)和 AI 應用程式在各個業務領域進行最佳化。這項技術可應用於工程、行銷、客戶服務、金融和銷售等各個領域。

生成式 AI 可用於擷取和彙總各種來源的資料以進行知識搜尋、評估和優化各領域的成本降低方案,以及產生合成資料來建立帶標籤的資料庫,用於監督式學習和其他 ML 程序。

提高員工生產力

生成式 AI 模型能夠增強員工工作流程,充當組織中每個人的高效助手。它們可以以類似人類的方式完成從搜尋到創建的所有任務。

生成式 AI 能提高不同類型員工的工作效率:

  • 支援創意任務,如根據特定輸入和條件產生多個原型,最佳化現有設計。
  • 為應用開發任務提供新的軟體程式碼建議。
  • 通過產生報告、摘要和預測支援管理工作。
  • 為行銷團隊生成新的銷售指令碼、郵件內容和部落格文章。

這樣可以節省時間、降低成本並提升整個組織的效率。

生成式人工智慧是如何運作的?

生成式人工智慧(簡稱生成式 AI)通過機器學習模型進行運作,這些模型基於大量的數據進行預先訓練,形成超大型的模型。

基礎模型

基礎模型(簡稱 FM)是指在大量的廣泛且未標記資料上經過訓練的機器學習模型。這些模型能夠執行多種一般性任務。

這些基礎模型是多年技術發展的最新成果,通常使用學習到的模式和關係來預測序列中的下一個元素。例如,在生成圖像時,模型會分析圖像並建立更清晰、更明確定義的圖像版本。對於文本,模型會根據先前的詞彙及其上下文來預測文本串中的下一個詞彙。然後,模型使用概率分佈技術來選擇下一個詞彙。

大型語言模型

大型語言模型(LLM)是一種特殊的基礎模型,例如 OpenAI 的生成式預訓練轉換器(GPT)模型就是 LLM。LLM 專門處理基於語言的任務,如摘要、文本生成、分類、開放式對話和資訊提取等。

LLM 的特點在於它能夠執行多項任務。這是因為 LLM 包含了大量的參數,使其能夠學習複雜的概念。像 GPT-3 這樣的 LLM 可以考慮數十億個參數,並且能夠根據極少量的輸入生成內容。通過在預訓練中接觸各種形式的大規模網絡資料,LLM 學會了在各種環境中應用其知識。

生成式 AI 如何運作?

傳統的機器學習模型具有區分性,或者側重於對數據點進行分類。它們試圖確定已知因素和未知因素之間的關係。例如,這些模型會檢視圖像的已知數據,如像素排列、線條、顏色和形狀等,然後將它們映射到未知因素,即詞彙。從數學角度來看,這些模型通過識別可以用數值方式將未知和已知因素映射為 x 和 y 變量的方程式來運作。

生成式模型則進一步發展。這些模型不僅僅在給定某些特徵的情況下預測標籤,而是在給定特定標籤的情況下嘗試預測特徵。從數學角度來看,生成式模型計算 x 和 y 同時出現的概率。該模型學習不同數據特徵的分佈及其相互關係。

例如,生成式模型會分析動物圖像以記錄變量,如不同的耳朵形狀、眼睛形狀、尾巴特徵和皮膚圖案。這些模型學習這些特徵及其相互關係,以了解不同動物的整體外觀。然後它們可以重新創建訓練集中未包含的新動物圖像。


接下來,我們將介紹幾種主要類別的生成式 AI 模型。

擴散模型

擴散模型通過對初始數據樣本進行反覆的受控隨機變化來創建新數據。這些模型以原始數據為起點,然後添加細微的變化(噪聲),使其逐漸與原始數據不那麼相似。這種噪聲通過精心控制,以確保生成的數據保持一致且逼真。

在多次迭代中添加噪聲後,擴散模型反轉該過程。反向去噪逐漸消除噪聲,以生成類似於原始數據的新數據樣本。

生成式對抗網絡 (GAN)

生成式對抗網絡(簡稱GAN)是基於擴散模型概念的一種生成式 AI 模型。

GAN 通過對抗式訓練來運作,它訓練兩個神經網絡以競爭的方式進行。第一個網路稱作_生成器_,它通過添加隨機噪聲來生成假的數據樣本。第二個網絡稱為_鑑別器_,它的工作是區分真實數據和生成器產生的假數據。

在訓練過程中,生成器不斷提升其創建逼真數據的能力,同時鑑別器也在不斷強化其區分真假數據的能力。這種對抗性訓練持續進行,直到生成器產生的數據足夠逼真,以至於鑑別器難以區分。

GAN 廣泛應用於創建逼真的圖像、風格轉換、數據增強等任務。

變分自動編碼器 (VAE)

變分自動編碼器(VAE)是學習數據的緊湊數學表示,稱為_潛在空間_。潛在空間是數據的數學化表示,可以被視為唯一的代碼,根據數據的所有特徵來表示數據。例如,在研究人臉時,潛在空間包含代表眼睛形狀、鼻子形狀、顳骨和耳朵的數字。

VAE 由兩個神經網絡組成 — 編碼器解碼器。編碼器將輸入數據映射到潛在空間的每個維度的均值和方差。然後從高斯(正態)分佈中生成隨機樣本。這個樣本是潛在空間中的一點,代表輸入數據的壓縮簡化版。

解碼器從潛在空間取得這個樣本點,然後將其重建回與原始輸入相似的數據。使用數學函數來衡量重建數據與原始數據的相似程度。

基於變換器的模型

基於變換器的生成式 AI 模型建立在 VAE 的編碼器和解碼器概念之上。這類模型在編碼器中新增了更多層,以提高處理文本任務如理解、翻譯和創意寫作的效能。

這些模型採用自注意力機制。在處理序列中的每個元素時,模型會考慮輸入序列中不同部分的重要性。

另一關鍵特性是這些 AI 模型實現了_情境嵌入_。序列中每個元素的編碼不僅取決於該元素本身,還取決於其在序列中的情境。

基於變換器的模型運作方式

要理解基於變換器的模型的運作方式,可以將一句話想像為一系列詞語。

自注意力機制幫助模型在處理每個詞語時將注意力集中在相關的詞語上。為了捕捉

詞語間不同類型的關係,基於變換器的生成式 AI 採用了稱為_注意力頭_的多個編碼器層。每個頭學習注意輸入序列的不同部分,使模型能夠同時考慮數據的各個方面。

每個層還對情境嵌入進行最佳化。這些層豐富了嵌入的信息,同時捕捉從語法結構到複雜語義的所有層面。

生成式 AI 技術的進化之路

在過去數十年裡,統計學已經利用基本生成式模型來輔助進行數據分析。神經網絡和深度學習則是推動現代生成式 AI 發展的最前沿技術。2013年開發出的變分自動編碼器(VAE)成為第一個能夠生成逼真圖像和聲音的深度生成式模型。

VAE 的創新在於它引入了創建各種資料類型新變體的能力。這項功能促進了如生成式對抗網絡(GAN)和擴散模型等其他生成式 AI 模型的快速發展。這些創新專注於使生成的資料更加逼真,儘管這些資料是人工創建的。

2017年,轉換器模型的出現進一步推動了 AI 研究的變革。轉換器將編碼器和解碼器的架構與注意力機制無縫整合,從而簡化了語言模型的訓練過程,提高了效率和多功能性。著名的模型如 GPT 已成為基礎模型,它們能在廣泛的原始文本資料庫上進行預訓練,並針對不同任務進行微調。

轉換器模型革新了自然語言處理的可能性,提供了從翻譯、摘要到問答等任務的生成式功能。

許多生成式 AI 模型持續實現突破,並已經成為跨行業應用的基石。最新的創新著眼於改善模型以使用專有資料,研究人員還希望創建越來越貼近人類行為的文字、圖像、視頻和聲音。

生成式 AI 如何改變工作方式的五個方向

「我可以自信地說,2023年將是 AI 發展史上最讓人興奮的一年。」微軟首席技術官 Kevin Scott 在公司 AI 部落格的問答中這樣寫道。他承認,曾認為2022年是最讓人興奮的一年,但創新的腳步只會越來越快,尤其是對生成式 AI 而言。這不僅是一種簡單分析數據的工具,更是能用來創作全新作品的工具,我們已經可以在像 GPT-3 這樣的系統中看到它的潛力,它能幫助使用者編輯文案和總結文字,提供創作者靈感;另外,DALL-E 2 則能根據輸入的提示創建具吸引力的作品。以下是 Kevin Scott 對 AI 如何改變人們工作和娛樂方式的預測。

1. AI 將激發我們的創造力

隨著生成式 AI 變得越來越流行和易於獲得,更多人將能夠利用這項技術進行創作,包括創作複雜的藝術品和動人的詩歌。Scott 在其博客文章中描述了新的人工智慧工具是如何讓設計變得大眾化的。「像 DALL-E 2 這樣的 AI 系統不會將普通人變成專業藝術家,但它為很多人提供了視覺化工具 —— 一種他們從未擁有過的超能力。」DALL-E 2 已經被整合到像 Microsoft Designer 這樣的工具中,它具有巨大的潛力,能讓更多人以專業的方式發揮創意。

2. AI 將使編寫程式碼更容易

創新的生成式 AI 如 GitHub Copilot(一個基於 OpenAI 的 Codex AI 系統構建的人工智慧)可以將自然語言轉化為程式設計代碼,將我們的想法變成複雜的執行軟體。在 Copilot 的使用者中,有 40% 的流行程式碼是由 Cop

ilot 生成的,這個比例還在不斷上升。Scott 在最近的 Fortune Brainstorm AI 研討會上指出,人們持續使用 ChatGPT(由 GPT-3.5 提供支援)顯示出其未來發展的潛力。「這確實為 AI 使用開啟了大門,」他說。「未來我們可能需要新的專業領域,但你不再需要電腦科學博士學位來構建 AI 應用,我認為這真的非常令人興奮。」

3. AI 也將成為我們最佳的助手

在《Wired》雜誌的一篇文章中,Scott 描述了 AI 如何幫助我們更有效地完成工作。就像 GitHub Copilot 的編碼協助一樣,從建築到醫療保健,從技術到法律行業,都可能從某種形式的 AI 協助中獲益。「這些 AI 應用具有無窮可能,遠遠超出了一個人的想象。生產力軟體能夠應用於複雜的工作場景,無論是編輯影片、撰寫劇本、為藥物設計新成分,還是建立3D模型。」雖然人們擔心 AI 將影響工作機會,但 Scott 在他的文章中指出,這些 AI 工具通過謹慎的應用,將能增強和放大人們的潛能,使人們能夠減少在重複性任務上的時間。他寫道,這些模式還將「使 AI 的使用變得大眾化」,從而「讓更多元的人參與到技術創新中來。」

4. AI 將加快反應週期

生成式 AI 能夠減少創作過程中的繁複工作,如幫助設計師更新產品概念,為作家生成新聞稿、論文和劇本的初稿,或協助平面設計(例如複雜的海報或影片剪輯等)。Scott 在他的《Wired》雜誌文章中指出,它有可能「讓知識工作者將時間花在更高層次的任務上,從而有效改變我們與科技互動完成工作的方式」。我們將通過與 AI 的合作,更熟練地掌握開發技術,以編輯和修改生成的圖像、文本、繪圖,甚至用於新藥的研發,加速反應週期並更快更好地創造產出。

5. AI 將讓工作更加愉快

在 AI 部落格的文章中,Scott 觀察到專為開發人員打造的 AI 工具將大幅提升整體的工作體驗。「現在人們手中有了新穎、有趣且效率更高的工具,」他指出。「這正是我們從那些使用 Copilot 的開發者那裡觀察到的現象。他們表示 Copilot 幫助他們完成工作,讓他們在過去枯燥乏味且重複的任務中保持思維敏捷。」這也適用於無程式碼和低程式碼工具,像 Power Platform 等產品,為工作職能、角色和流程創造了新的可能性。「我們的研究發現,使用無程式碼或低程式碼工具對工作滿意度、整體工作量和工作氛圍帶來了超過 80% 的正面影響。」

生成式 AI 有能力改變許多職業的工作方式,催生並使既定的職業轉型。透過謹慎和符合倫理的部署,它將成為促進創造力革命的工具,使每個人都能更好地表達自己的想法。

生成式 AI 解析:

生成式人工智慧是一類能夠創建各種內容的人工智慧技術,包括文字、圖像、音訊和合成數據。最近,圍繞生成式 AI 的熱議主要是由於新的使用者介面的簡便性所推動的,這些介面能在幾秒鐘內創建高品質的文字、圖形和影片。

值得一提的是,這項技術並非全新。生成式 AI 最早在 20 世紀 60 年代的聊天機器人中被引入。然而,直到 2014 年生成對抗網路(GAN)——一種機器學習演算法的出現,生成式人工智慧才能夠創建令人信服的真實人物影像、視訊和音訊。

這種新發現的能力帶來了機遇,包括更好的電影配音和豐富的教育內容,但同時也引發了對深度偽造(數位偽造影像或影片)以及對企業構成威脅的網路安全攻擊的擔憂,這些攻擊包括真實模仿員工老闆的惡意請求。

以下將詳細探討其他兩項關鍵進展,這些進展在生成式人工智慧走向主流過程中發揮了關鍵作用:變壓器及其實現的突破性語言模型。Transformer 是一種機器學習,使研究人員能夠在不預先標記所有數據的情況下訓練更大的模型,因此新模型可以在數十億頁的文本上進行訓練,從而獲得更深入的答案。此外,Transformers 還開啟了稱為「注意力」的新概念,使模型能夠追蹤頁面、章節和書籍中的單字之間的聯繫,而不僅僅是單個句子中的單字之間的聯繫。不僅限於文字:Transformers 還可以利用其追蹤聯繫的能力來分析代碼、蛋白質、化學物質和 DNA。

所謂的大語言模型(LLM)——即具有數十億甚至數萬億參數的模型——的快速發展開啟了一個新時代,生成式人工智慧模型可以編寫引人入勝的文本、繪製逼真的圖像,甚至創造一些有趣的內容即時情境喜劇。此外,多模式人工智慧的創新使團隊能夠跨多種類型的媒體生成內容,包括文字、圖形和視訊。這是 Dall-E 等工具的基礎,這些工具可以根據文字描述自動建立圖像或根據圖像生成文字標題。

儘管取得了這些突破,但我們仍處於使用生成式人工智慧創建可讀文字和逼真的風格化圖形的早期階段。早期的實現存在準確性和偏見問題,並且容易產生幻覺並吐出奇怪的答案。儘管如此,迄今為止的進展表明,這種生成式人工智慧的固有能力可以從根本上改變企業技術和企業的運作方式。展望未來,這項技術可以幫助編寫程式碼、設計新藥、開發產品、重新設計業務流程和轉變供應鏈。

生成式 AI 如何運作?

生成式人工智慧從提示開始,提示可以是文字、圖像、視訊、設計、音符或任何其他人工智慧系統能處理的輸入形式。然後,各種人工智慧演算法根據提示回傳新的內容。內容可以是文章、問題的解決方案,或者是根據人物的圖片或音訊創建的逼真仿造品。

早期版本的生成式人工智慧需要透過 API 或其他複雜的過程來提交數據。開發者需要熟悉特殊工具並使用像 Python 這樣的語言來編寫應用程序。

現在,生成式人工智慧領域的先驅們正在開發更佳的使用者體驗,讓你可以用簡單的語言來描述請求。在獲得初始回應後,你還可以透過反饋來自定義結果,包括樣式、語調和其他元素,以反映你希望生成的內容。

生成式 AI 模型

生成式人工智慧模型結合了多種人工智慧演算法來表示和處理內容。例如,為了生成文本,各種自然語言處理技術將原始字元(如字母、標點符號和單詞)轉換成句子、詞性、實體和動作,它們使用多種編碼技術被表示為向量。同樣,圖像被轉換為各種視覺元素,也以向量形式表示。需要注意的是,這些技術也可能對訓練數據中包含的偏見、種族主義、欺騙和誇大其詞進行編碼。

一旦開發人員確定了一種代表世界的方式,他們就會應用特定的神經網路來產生新內容以回應查詢或提示。例如,GAN 和變分自動編碼器(VAE)(帶有解碼器和編碼器的神經網路)適合生成逼真的人臉、用於人工智慧訓練的合成數據,甚至特定人類的傳真。

Transformers 的最新進展,例如 Google 的雙向編碼器表示 (BERT)、OpenAI 的 GPT 和 Google AlphaFold,也催生了神經網路,它不僅能編碼語言、圖像和蛋白質,還能生成新內容。

LLM 自然語言處理有哪些生成模型?

自然語言處理的一些生成模型包括:

  • 卡內基美隆大學的 XLNet
  • OpenAI 的 GPT(生成式預訓練變壓器)
  • Google 的 ALBERT(輕量級BERT)
  • Google 的 BERT
  • Google LaMDA
大科技公司目前對生成式 AI 與語言模型的投入

神經網路如何改變生成式人工智慧

神經網路構成了當今大部分人工智慧和機器學習應用的基礎,它扭轉了這個問題。神經網路旨在模仿人類大腦的工作方式,透過在現有資料集中尋找模式來「學習」規則。第一個神經網路誕生於 20 世紀 50 年代和 20 世紀 60 年代,但由於缺乏運算能力和小數據集而受到限制。直到 2000 年代中期大數據的出現和電腦硬體的改進,神經網路才開始實用於產生內容。

當研究人員找到一種讓神經網路在電腦遊戲產業用來渲染電玩遊戲的圖形處理單元 (GPU) 上並行運行的方法時,這一領域的發展加速了。過去十年中開發的新機器學習技術,包括前面提到的生成對抗網路和變壓器,為最近人工智慧生成內容的顯著進步奠定了基礎。

什麼是 Dall-E、ChatGPT 和 Bard?

ChatGPT、Dall-E 和 Bard 是流行的生成式 AI 介面。

DALL-E: Dall-E經過大型圖像資料集及其相關文字描述的訓練,是多模式 AI 應用程式的範例,可識別跨多種媒體(例如視覺、文字和音訊)的連接。在這種情況下,它將單字的含義與視覺元素聯繫起來。它是在 2021 年使用OpenAI的 GPT 實現構建的。 Dall-E 2 是第二個更強大的版本,於 2022 年發布。它使用戶能夠在用戶提示的驅動下生成多種風格的圖像。

ChatGPT: 2022 年 11 月席捲全球的人工智慧聊天機器人是基於 OpenAI 的 GPT-3.5 實作而建構的。OpenAI 提供了一種透過具有互動式回饋的聊天介面進行互動和微調文字回應的方法。早期版本的 GPT 只能透過 API 存取。GPT-4於 2023 年 3 月 14 日發布。ChatGPT將其與用戶的對話歷史記錄納入其結果中,模擬真實對話。在新的 GPT 介面大受歡迎之後,微軟宣布對 OpenAI 進行重大新投資,並將 GPT 版本整合到其 Bing 搜尋引擎中。

ChatGPT 和 Bard 之間差異的快照。

詩人。 谷歌是開創用於處理語言、蛋白質和其他類型內容的 Transformer AI 技術的另一位早期領導者。它為研究人員開源了其中一些模型。然而,它從未發布這些模型的公共介面。微軟決定在 Bing 中實施 GPT 促使 Google 急於推出一款面向大眾的聊天機器人 Google Bard,該機器人基於其 LaMDA 系列大型語言模型的輕量級版本構建。巴德倉促上市後,Google股價遭受重大損失,因為語言模型錯誤地表示韋伯望遠鏡是第一個在外國太陽系發現行星的望遠鏡。同時,微軟和 ChatGPT 的實施也因為結果不準確和行為不穩定而在早期的表現中丟了面子。此後,Google 推出了基於其最先進的 LLM PaLM 2的 Bard 新版本,該版本使 Bard 能夠更有效率、更直觀地回應用戶查詢。

生成式 AI 的應用範例?

生成式 AI 可以應用於各種用例,以產生幾乎任何類型的內容。得益於GPT 等尖端突破,可以針對不同的應用程式進行調整,該技術正變得越來越適合各類用戶。生成式人工智慧的一些用例包括:

  • 實施聊天機器人以提供客戶服務和技術支援。
  • 部署 Deepfakes 來模仿人甚至特定的個人。
  • 改進不同語言的電影和教育內容的配音。
  • 撰寫電子郵件回覆、約會資料、履歷和學期論文。
  • 以特定風格創作逼真的藝術作品。
  • 改進產品示範影片。
  • 建議測試新藥物化合物。
  • 設計實體產品和建築物。
  • 優化晶片設計。
  • 以特定的風格或語調創作音樂。
AI 工具目前在各個專業領域的領導者 by CBINSIGHTS

生成式人工智慧有哪些好處?

生成式人工智慧可以廣泛應用於許多業務領域。它可以使解釋和理解現有內容變得更容易,並自動創建新內容。開發人員正在探索生成式人工智慧改進現有工作流程的方法,並著眼於完全調整工作流程以利用該技術。實施生成式人工智慧的一些潛在好處包括:

  • 自動化編寫內容的手動流程。
  • 減少回覆電子郵件的工作量。
  • 改進對特定技術查詢的回應。
  • 創建人物的真實再現。
  • 將複雜的訊息總結成連貫的敘述。
  • 簡化以特定風格創建內容的過程。

生成式人工智慧有哪些限制?

生成式人工智慧的早期實施生動地說明了它的許多限制。生成式人工智慧面臨的一些挑戰是由用於實現特定用例的特定方法造成的。例如,複雜主題的摘要比包含支援關鍵點的各種來源的解釋更容易閱讀。然而,摘要的可讀性是以使用者無法審查資訊來源為代價的。

以下是實施或使用生成式人工智慧應用程式時需要考慮的一些限制:

  • 它並不總是識別內容的來源。
  • 評估原始來源的偏見可能具有挑戰性。
  • 聽起來真實的內容使得識別不準確的資訊變得更加困難。
  • 要理解如何適應新環境可能很困難。
  • 結果可以掩蓋偏見、成見和仇恨。

圍繞生成人工智慧有哪些擔憂?

生成式人工智慧的興起也引發了各種擔憂。這些涉及結果的品質、誤用和濫用的可能性以及破壞現有商業模式的可能性。以下是生成式人工智慧當前狀態所帶來的一些具體類型的問題:

  • 它可能提供不準確和誤導性的信息。
  • 如果不知道資訊的來源和出處,就更難以信任。
  • 它可能會助長新型抄襲行為,忽略原創內容的內容創作者和藝術家的權利。
  • 它可能會破壞圍繞搜尋引擎優化和廣告建立的現有商業模式。
  • 它使製造假新聞變得更容易。
  • 這使得人們更容易聲稱錯誤行為的真實照片證據只是人工智慧生成的贗品。
  • 它可以冒充人們進行更有效的社會工程網路攻擊。
推出 Claude 公司 Anthropic,他們 的 AI 宣言
Open AI 的競爭者 Anthropic,他們 的 AI 採用了一種截然不同的設計方法,稱為憲法人工智慧。這涉及根據人類對物理、心理學和社會動力學的固有理解來訓練人工智慧。憲政人工智慧旨在創造有幫助、無害且誠實的助理。
Anthropic的崛起:從AI新創到300億美金的獨角獸
Anthropic:AI界的新星。隨著資金大量流入AI領域,AI新創公司呈現出明顯的兩極化。在這之中,Anthropic無疑成為暨 OpenAI 後今年最受矚目的獨角獸。

生成式人工智慧工具有哪些範例?

生成式人工智慧工具適用於各種形式,例如文字、圖像、音樂、程式碼和語音。一些值得探索的流行人工智慧內容產生器包括:

  • 文字產生工具包括 GPT、Jasper、AI-Writer 和 Lex。
  • 影像生成工具包括 Dall-E 2、Midjourney 和 Stable Diffusion。
  • 音樂產生工具包括 Amper、Dadabots 和 MuseNet。
  • 程式碼產生工具包括 CodeStarter、Codex、GitHub Copilot和 Tabnine。
  • 語音合成工具包括Descript、Listnr和Podcast.ai。
  • AI晶片設計工具公司包括Synopsys、Cadence、Google和Nvidia。

按行業劃分的生成式 AI 案例:

生成式 AI 將如何影響產業?

生成式人工智慧(簡稱生成式 AI)將對各行各業產生深遠影響。某些領域可能會迅速從這項先進技術中獲益。

金融服務領域

金融機構可以利用生成式 AI 的強大功能,在削減成本的同時為客戶提供升級服務:

  • 運用聊天機器人來提供產品建議和回答客戶查詢,從而提升客戶服務水平。
  • 對於金融服務不足的市場(特別是發展中國家),貸款機構可以迅速完成貸款核准。
  • 銀行能迅速識別和處理索賠、信用卡和貸款中的詐騙行為。
  • 投資公司能夠利用生成式 AI 的強大功能,以較低的成本為客戶提供安全、個人化的財務建議。

醫療保健與生命科學

生成式 AI 在加速藥物發現和科學研究方面有著巨大潛力。這種技術可以創建具有特定特性的新型蛋白質序列,進而設計出抗體、酶、疫苗和基因療法。

醫療保健和生命科學領域的公司可以利用生成式模型設計合成基因序列,用於合成生物學和代謝工程。這些公司還可以創建新的生物合成途徑或最佳化生物製造過程中的基因表達。

此外,生成式 AI 可用於建立合成患者和醫療保健數據。這對於在沒有訪問大型現實世界數據集的情況下訓練 AI 模型、模擬臨床試驗或研究罕見疾病非常有益。

汽車與製造業

汽車公司可以將生成式 AI 運用於從工程設計到車內體驗和客戶服務的各個方面。例如,這些公司可以最佳化機械零件設計以減少車輛阻力,或調整輔助系統設計。

利用生成式 AI,汽車公司可以通過快速解答常見客戶問題來提供更優質的客戶服務。它們還可以利用此技術創建新的材料、晶片和零件設計,從而最佳化製造流程並降低成本。此外,生成式 AI 也可用於產生合成數據以測試應用程序,這對於通常不包含在測試數據集中的缺陷或邊緣情況特別有用。

媒體與娛樂業

生成式 AI 能夠以傳統製作成本和時間的一小部分產生創新內容,從動畫和劇本到完整電影。

以下是生成式 AI 在媒體與娛樂業中的其他應用方式:

  • 藝術家可以利用由 AI 生成的音樂來增強其專輯,創造全新的聽覺體驗。
  • 媒體機構可以利用生成式 AI 提供個性化內容和廣告,以改善觀眾體驗並增加收入。
  • 遊戲公司可以利用生成式 AI 開發新遊戲,讓玩家在遊戲中創建自己的角色。

電信行業

在電信行業中,生成式 AI 的早期應用案例專注於改造客戶體驗。客戶體驗由用戶在整個客戶旅程中的所有互動累積而成。

電信組織可以利用生成式 AI 通過類似人類的即時對話代理來改善客戶服務。他們還可以分析網絡數據以推薦維修方案,從而最佳化網絡性能。此外,通過個性化的一對一銷售助手,他們還可以改造客戶關係。

能源行業

生成式 AI 適用於涉及複雜原始數據分析、模式識別、預測和最佳化的能源部門任務。能源組織可以通過分析企業數據來識別使用模式,從而改善客戶服務。憑藉這些資訊,組織可以開發

針對性的產品、能源效率計畫或需求響應計畫。生成式 AI 可幫助電網管理、提高作業現場安全性,並通過儲油氣層模擬優化能源生產。

新的生成式人工智慧技術有時被描述為類似於蒸汽動力、電力和計算的通用技術,因為它們可以深刻影響許多行業和用例。必須記住的是,與以前的通用技術一樣,人們通常需要數十年的時間才能找到組織工作流程的最佳方式來利用新方法,而不是加快現有工作流程的一小部分。以下是生成式 AI 應用可能影響不同產業的一些方式:

More:

  • 財務部門可以在個人歷史背景下觀察交易,以建立更好的詐欺偵測系統。
  • 律師事務所可以使用 AI 來設計和解釋合約、分析證據並提出論點。
  • 製造商可以使用 AI 結合來自攝影機、X 射線和其他指標的數據,以更準確、更經濟地識別缺陷零件和根本原因。
  • 電影和媒體公司可以使用 AI 更經濟地製作內容,並用演員自己的聲音將其翻譯成其他語言。
  • 醫療產業可以使用 AI 來更有效地識別有前途的候選藥物。
  • 建築公司可以使用 AI 來更快地設計和調整原型。
  • 遊戲公司可以使用 AI 來設計遊戲內容和關卡。


GPT 加入通用技術萬神殿

OpenAI 是一家人工智慧研究和部署公司,它採用 Transformer 背後的核心思想來訓練其版本,稱為生成式預訓練 Transformer(GPT)。觀察家注意到,GPT 與描述蒸汽機、電力和計算等通用技術的縮寫相同。大多數人都同意,隨著研究人員發現將 GPT 和其他 Transformer 實現應用於工業、科學、商業、建築和醫學的方法,GPT 和其他 Transformer 實現已經名副其實。

生成人工智慧中的道德和偏見

儘管他們做出了承諾,但新的生成式人工智慧工具在準確性、可信度、偏見、幻覺和抄襲方面引發了一系列問題——這些道德問題可能需要數年時間才能解決。對人工智慧來說,這些問題都不是特別新鮮。例如,微軟於 2016 年首次涉足聊天機器人,名為 Tay,但由於它開始在 Twitter 上發表煽動性言論,因此不得不關閉。

新鮮_的_是,最新一批生成式人工智慧應用程式表面上聽起來更加連貫。但這類人語言和連貫性的結合並不等同於人類智能,目前關於生成式人工智慧模型是否可以被訓練具有推理能力存在很大爭議。一名谷歌工程師甚至在公開宣稱該公司的生成式人工智慧應用程式「對話應用程式語言模型」(LaMDA)具有感知能力後被解僱。

生成式人工智慧內容令人信服的現實性引入了一系列新的人工智慧風險。它使得檢測人工智慧產生的內容變得更加困難,更重要的是,使得檢測錯誤時變得更加困難。當我們依賴生成式人工智慧結果來編寫程式碼或提供醫療建議時,這可能是一個大問題。生成式人工智慧的許多結果並不透明,因此很難確定它們是否侵犯了版權,或者它們得出結果的原始來源是否存在問題。如果你不知道人工智慧是如何得出結論的,你就無法推理為什麼它可能是錯的。

生成式 AI 與 AI 的差異

生成式人工智慧專注於創造新的原創內容、聊天回應、設計、合成資料甚至深度偽造。它在創意領域和解決新問題時特別有價值,因為它可以自主產生多種類型的新輸出。

如上所述,生成式 AI 依賴 Transformer、GAN 和 VAE 等神經網路技術。與之不同的是,其他類型的人工智慧使用的技術 包括卷積神經網路、循環神經網路和強化學習。

生成對抗網路(GAN)是一種深度學習模型,近年來因其生成逼真圖像、視訊和其他類型資料的能力而受到廣泛關注。GAN 由兩個神經網路、一個生成器和一個判別器組成,玩兩人遊戲。生成器產生合成數據,而鑑別器則嘗試區分真實數據和虛假數據。生成器經過訓練可以產生可以欺騙鑑別器的輸出,而鑑別器經過訓練時可以正確區分真數據和假數據。儘管 GAN 取得了成功,但也面臨挑戰。最重大的挑戰之一是模式崩潰。

當 GAN 僅產生一組有限的輸出範例而不是探索訓練資料的整個分佈時,就會發生模式崩潰。換句話說,GAN 的生成器陷入了特定的模式或模式,無法產生覆蓋整個資料範圍的多樣化輸出。這可能會導致產生的輸出顯得重複、缺乏多樣性和細節,有時甚至與訓練資料完全無關。

基於合成資料的 GAN深度學習模型訓練

生成式人工智慧通常以提示開始,讓使用者或資料來源提交起始查詢或資料集來指導內容產生。這可以是探索內容變化的迭代過程。另一方面,傳統的人工智慧演算法通常遵循一組預先定義的規則來處理資料並產生結果。

根據要解決的問題,這兩種方法都有各自的優點和缺點,生成式人工智慧非常適合涉及 NLP 並要求創建新內容的任務,而傳統演算法對於涉及基於規則的處理和預定結果的任務更有效。

生成式AI、預測性AI、對話式AI

與生成式人工智慧不同,預測式人工智慧使用歷史資料中的模式來預測結果、對事件進行分類並提供可行的見解。組織使用預測人工智慧來加強決策並制定數據驅動的策略。

對話式人工智慧可幫助虛擬助理、聊天機器人和客戶服務應用程式等人工智慧系統以自然的方式與人類互動。它使用 NLP 和機器學習技術來理解語言並提供類似人類的文字或語音回應。

生成式人工智慧的歷史

Joseph Weizenbaum 在 20 世紀 60 年代創建的 Eliza 聊天機器人是生成式人工智慧最早的例子之一。這些早期的實現使用基於規則的方法,由於詞彙量有限、缺乏上下文和過度依賴模式等缺點,該方法很容易崩潰。早期的聊天機器人也很難客製化和擴展。

2010 年,隨著神經網路和深度學習的進步,該技術能夠自動學習解析現有文本、對圖像元素進行分類和轉錄音頻,該領域出現了復興。

Ian Goodfellow 於 2014 年推出了 GAN。這種深度學習技術提供了一種新穎的方法來組織競爭性神經網路來產生內容變化並對其進行評分。這些可以產生真實的人物、聲音、音樂和文字。這激發了人們對如何使用生成式人工智慧來創建模仿影片中的聲音和人物的逼真深度偽造品的興趣和恐懼。

從那時起,其他神經網路技術和架構的進步幫助擴展了生成式人工智慧的能力。技術包括 VAE、長短期記憶、變壓器、擴散模型和神經輻射場。

使用生成式人工智慧的最佳實踐

使用生成式人工智慧的最佳實踐將根據模式、工作流程和期望目標而有所不同。也就是說,在使用生成人工智慧時,考慮準確性、透明度和易用性等基本因素非常重要。以下做法有助於實現這些因素:

  • 為使用者和消費者清楚標記所有產生人工智慧內容。
  • 在適用的情況下使用主要來源審查生成內容的準確性。
  • 考慮偏見如何融入生成的人工智慧結果。
  • 使用其他工具仔細檢查人工智慧產生的程式碼和內容的品質。
  • 了解每種生成式人工智慧工具的優點和限制。
  • 熟悉結果中的常見故障模式並解決這些問題。

生成式人工智慧的未來

ChatGPT 令人難以置信的深度和易用性刺激了生成式人工智慧的廣泛採用。可以肯定的是,生成式人工智慧應用程式的快速採用也證明了安全、負責任地推廣這項技術的一些困難。但這些早期的實施問題激發了人們對更好的工具的研究,以檢測人工智慧生成的文字、圖像和影片。

事實上,ChatGPT、Midjourney、Stable Diffusion 和 Bard 等生成式 AI 工具的流行也催生了各種專業級別的培訓課程層出不窮。許多旨在幫助開發人員創建人工智慧應用程式。其他人則更關注希望在整個企業中應用新技術的企業用戶。在某種程度上,行業和社會也將建立更好的工具來追蹤資訊的來源,以創建更值得信賴的人工智慧。

生成式人工智慧將繼續發展,在翻譯、藥物發現、異常檢測和新內容生成(從文字和影片到時裝設計和音樂)方面取得進展。儘管這些新的一次性工具非常好,但生成式人工智慧未來最重大的影響將來自於將這些功能直接整合到我們已經使用的工具中。

例如,語法檢查器將會變得更好。設計工具將無縫地將更有用的建議直接嵌入到我們的工作流程中。培訓工具將能夠自動識別組織某一部分的最佳實踐,以幫助更有效地培訓其他員工。這些只是產生人工智慧將在短期內改變我們所做的事情的一小部分。

生成式人工智慧未來會產生什麼影響很難說。但當我們繼續利用這些工具來自動化和增強人類任務時,我們將不可避免地發現自己必須重新評估人類專業知識的本質和價值。

什麼是通用人工智慧 AGI(Artificial General Intelligence)?
你知道人工智慧叫做 AI,但你知道 AGI 嗎?AGI 被認為是 目前強人工智慧,也被稱為通用人工智慧 AGI。

生成式AI - 常見問題

誰創造了生成式AI?

Joseph Weizenbaum 在 20 世紀 60 年代創建了第一個生成式人工智慧,作為 Eliza 聊天機器人的一部分。伊恩古德費洛 (Ian Goodfellow) 於 2014 年展示了生成對抗網絡,可以生成外表和聲音逼真的人。Open AI 和 Google 對法學碩士的後續研究點燃了最近的熱情,並演變成了 ChatGPT、Google Bard 和 Dall-E 等工具。

AI如何取代工作?

生成式人工智慧有可能取代多種工作,包括:

  • 撰寫產品說明。
  • 創建行銷文案。
  • 產生基本的網頁內容。
  • 啟動互動銷售推廣。
  • 回答客戶的問題。
  • 為網頁製作圖形。

一些公司將盡可能尋找替代人類的機會,而其他公司將使用生成式人工智慧來增強和增強現有的勞動力。

如何建立生成式AI模型?

生成式AI模型首先對要產生的內容進行有效編碼。例如,文字的生成AI模型可能首先找到一種將單字表示為向量的方法,該向量表徵同一句子中經常使用的單字之間的相似性或表示相似事物的單字之間的相似性。

LLM 研究的最新進展幫助業界實施了相同的流程來表示圖像、聲音、蛋白質、DNA、藥物和 3D 設計中發現的模式。這種生成式人工智慧模型提供了一種有效的方式來表示所需的內容類型並有效地迭代有用的變化。

如何訓練生成式AI模型?

生成式AI模型需要針對特定用例進行訓練。法學碩士的最新進展為針對不同用例客製化應用程式提供了理想的起點。例如,OpenAI 開發的流行 GPT 模型已被用來根據書面描述編寫文字、生成程式碼和創建圖像。

訓練涉及針對不同用例調整模型參數,然後根據給定的訓練資料集微調結果。例如,呼叫中心可能會針對服務代理從各種客戶類型中提出的問題以及服務代理給予的回應來訓練聊天機器人。與文字不同,圖像生成應用程式可能會從描述圖像內容和風格的標籤開始,以訓練模型生成新圖像。

生成式AI如何改變創意工作?

生成式人工智慧有望幫助創意工作者探索各種想法。藝術家可能會從基本的設計概念開始,然後探索變化。工業設計師可以探索產品的變化。建築師可以探索不同的建築佈局,並將其視覺化,作為進一步完善的起點。

它還可以幫助創意工作的某些方面實現民主化。例如,商業用戶可以使用文字描述來探索產品行銷圖像。他們可以使用簡單的命令或建議進一步完善這些結果。


生成式 AI 導入商業的最佳做法有哪些?

若您的組織打算實施生成式 AI 解決方案,請考慮以下幾種最佳做法來加強實施效果。

從內部應用開始實施

建議從針對內部應用的開發開始實施生成式 AI,專注於優化流程和提升員工生產力。這樣可以在可控的環境中測試結果,同時培養對相關技術的技能和理解。可以在廣泛的測試範圍內測試模型,甚至可以基於內部知識源來自訂模型。

這樣做能確保當這些模型最終用於外部應用時,客戶將獲得更佳的體驗。

提高透明度

對於所有生成式 AI 應用和輸出進行清晰溝通,以便使用者明白他們是在與 AI 而非人類互動。例如,AI 可以自我介紹為AI,或者可以標明和突出顯示基於 AI 的搜索結果。

這樣一來,使用者可以在與內容互動時作出更加明智的判斷。他們也能更主動地處理潛在的不準確或隱藏偏差(可能由於訓練數據的局限性而產生)。

實施安全措施

實施防護措施以確保生成式 AI 應用不會不慎允許未經授權的敏感數據訪問。從一開始就讓安全團隊參與其中,以便考慮到所有安全因素。例如,在基於內部數據訓練任何模型之前,你可能需要對數據進行遮蔽處理並移除個人身份識別信息(PII)。

進行廣泛測試

開發自動化和手動測試程序來驗證結果,並測試生成式 AI 系統可能遇到的所有場景類型。讓不同的測試組以不同方式使用應用並記錄結果。模型將通過測試不斷進行改進,你也能更全面地控制預期結果和響應。

生成式 AI 的常見應用有哪些?

利用生成式 AI,你的企業能夠更快地充分利用機器學習,並將其應用於更廣泛的用例。你可以將生成式 AI 應用於工程、市場營銷、客戶服務、財務和銷售等所有業務範疇。程式碼生成是生成式 AI 最有前景的應用之一,通過 GitHub Copilot(AI 編程輔助工具),我們已經在開發人員生產力方面取得了顯著的進展。在預覽期間,使用 GitHub Copilot 的參與者不僅完成任務的成功率提高了 27%,而且比未使用 Copilot 的使用者平均快了 57%。

除了程式碼生成,還有許多應用場景可以利用生成式 AI 實現客戶體驗、員工生產力、業務運營效率和創造力的飛躍式提升。你可以使用生成式 AI 通過聊天機器人、虛擬助理、智能聯絡中心、個性化和內容審核等功能來改善客戶體驗。你可以利用採用生成式 AI 的對話式搜索、內容創建和文本摘要等,提高員工的生產力。你可以通過智能文檔處理、維護助手、質量控制和視覺檢查,以及合成訓練數據生成來改善業務運營。最後,你可以使用生成式 AI 通過文字、動畫、影片和圖像生成,加速藝術和音樂中所有類型的創意內容製作。

生成式AI的未來發展有哪些趨勢?

ChatGPT 展現了生成式AI在創建類人文字方面的能力,同時也揭示了這領域未來可能面臨的問題與挑戰。

短期來看,工作的重點將放在利用生成式AI工具來優化使用者體驗和工作流程。此外,建立對生成結果的信任也將是關鍵。許多企業也將基於自身的數據定制生成式AI,以此來提升品牌影響力和溝通效果。開發團隊將利用生成式AI實施特定公司的最佳實踐,以創建更具可讀性和一致性的程式碼。

供應商將集成生成式AI功能到他們的附加工具中,簡化內容創建工作流程,這將推動這些新功能如何提高生產力的創新。作為加強分析工作流程的一部分,生成式AI也將在數據處理、轉換、標記和審核等方面發揮作用。語義網絡應用可以利用生成式AI自動將內部分類學映射到技能培訓和招聘網站上的不同分類。同樣,業務團隊將使用這些模型轉換和標記第三方數據,實現更複雜的風險評估和機會分析。

長遠來看,生成式AI模型將擴展以支持3D建模、產品設計、藥物開發、數字孿生、供應鏈和業務流程等領域。這將使創造新產品理念、嘗試不同組織模式及探索各種商業創意變得更加容易。


生成式AI技術專有名詞解釋:

AI藝術(人工智慧藝術)
利用 AI 工具創建或增強的任何形式的數位藝術。

AI 提示
人工智慧提示是促使模型生成預期輸出的人機互動模式。這種互動可以是問題、文字、程式碼片段或範例。

AI 提示工程師
專門創建文字提示或線索的專家,這些提示或線索能被大型語言模型和生成式 AI 工具理解和解釋。

Auto-GPT
Auto-GPT 是基於 GPT-4 語言模型的開源自主 AI 代理,能夠自主地連接任務以實現用戶設定的總體目標。

Google Gemini
Google Gemini 是具備語言、音頻、程式碼和視頻理解能力的多模態AI大語言模型家族。

Google 搜尋生成體驗
Google 搜尋生成體驗是一組將人工智慧驅動的生成結果整合進 Google 搜尋引擎回應中的搜尋和介面功能。

Google 搜尋實驗室 (GSE)
GSE 是 Google 部門的一項計劃,旨在為 Google 搜尋提供新功能和實驗,以便在公開發布前以預覽格式提供。

影像轉換
影像到影像轉換是將來源影像轉換為目標影像的生成式 AI 技術,同時保留原始影像的某些視覺屬性。

初始分數
初始分數是衡量或確定通過生成對抗網路(GAN)創建的影像品質的演算法。「初始」指的是創造力的火花或思想或行動的起始階段。

LangChain
LangChain 是一個開源框架,允許開發人員將大型語言模型與其他外部組件結合,開發由 LLM 驅動的應用。

Q-learning
Q-learning 是一種機器學習方法,通過正確的行動選擇迭代學習和改進,以優化模型的表現。

基於人類回饋的強化學習 (RLHF)
RLHF 是將強化學習技術(如獎勵和比較)與人類指導相結合的機器學習方法,用於訓練 AI 代理。

檢索增強生成
檢索增強生成是一種框架,它從外部知識來源檢索資料以提高回應品質的人工智慧方法。

變分自動編碼器 (VAE)
變分自動編碼器是一種生成式 AI 演算法,使用深度學習生成新內容、偵測異常並消除雜訊。


結語: AI是否會獲得意識?

一些AI的支持者認為,生成式AI可能是通往通用AI甚至意識的重要一步。例如,Google LaMDA 聊天機器人的一位早期測試者曾聲稱該機器人具有某種感知能力,此言論引起了廣泛關注,隨後他被公司解雇。

AI 的 科技奇點(Technology Singularity)或許已經離我們不遠

1993年,美國科幻作家兼電腦科學家弗諾·文奇(Vernor Vinge)提出,在未來30年內,我們將擁有創造「超人類智慧」的技術能力,即比人類更聰明的AI,到那時人類的時代可能會走向終結。AI先驅 Ray Kurzweil 預測,到 2045 年將出現這樣的「奇點」(科技奇點(Technology Singularity)。

然而,許多其他AI專家認為這一目標還相當遙遠。機器人學先驅羅德尼·布魯克斯(Rodney Brooks)預計,在我們有生之年內,AI不太可能獲得 6 歲兒童的感知能力,但到了 2048 年,它可能會像狗一樣聰明和專注。

Share this post