Sundar Pichai:Gemini 3、Vibe Coding 與 Google 的全端策略
Roger’s Takeaway
Sundar Pichai簡短的訪談,裡面談到Google AI優先是從2016年開始,決定性因素有三個,2012年Google Brian的貓咪論文、2014年收購Deep Mind、2016年Alpha Go時刻以及第一代TPU。
他在當時看到第一次平台轉移。而在2023年,他看到生成式AI時刻的到來,因此合併Google Brain 和 Google DeepMind,以集中、加大投資,並且確保所有產品都融入Gemini。
Google總是會押注長期賭注,包括Waymo、量子運算,以及許多後來被證明失敗的專案,目前看起來,幫助Google最成功的還是廣告,然而,以Google的技術累積,頗有當年AT&T擁有貝爾實驗室的感覺,最強的科學家聚集在Google,從軟體到硬體一把抓的技術實力,以及擁有終端產品與應用的渠道。
很難找到在這個時代有公司能夠超越Google的理由。
PS.也可能是因為我是奈米股東,因此產生了偏見誤差。
更多筆記請見留言連結
摘要
Google 執行長 Sundar Pichai 與 Google DeepMind 團隊的 Logan Kilpatrick 深入探討 Gemini 3 與 Nano Banana Pro 的發布。訪談涵蓋了 Google 從 2016 年確立的 AI 優先與全端策略、基礎建設的長期投資、Vibe Coding 如何釋放公眾創造力,以及包括太空資料中心在內的未來展望。
Bio
Sergey Brin
作為Google的共同創辦人,Sergey Brin於1998年與拉里·佩奇共同開發了PageRank演算法,奠定了Google在搜尋引擎領域的霸主地位;隨後他轉向領導Google X(現為X Development),推動Google Glass、Waymo自駕車等前瞻性的「登月計畫」,並於2015年出任Alphabet總裁;儘管在2019年一度卸下管理職務,但隨著生成式AI浪潮興起,他於2023年重返技術第一線,頻繁進出總部參與程式碼撰寫與技術決策,成為推動Gemini模型誕生與Google全端AI策略的關鍵靈魂人物。
Jeff Dean
Jeff Dean自1999年加入Google以來,早期透過共同設計MapReduce、BigTable、Spanner等分佈式計算系統,構建了Google得以處理全球海量數據的基礎架構;隨後他將重心轉向人工智慧,創立Google Brain團隊並主導TensorFlow框架的開發,在其領導下團隊孕育出了Transformer架構;現任Google首席科學家(Chief Scientist)的他,於2023年推動Google Brain與DeepMind的合併,將其深厚的系統工程經驗與深度學習研究結合,為Gemini系列模型的訓練與擴展提供了堅實的技術地基。
Sanjay Ghemawat
Sanjay Ghemawat於1999年加入Google,是公司內極少數榮獲Google Fellow最高技術榮譽的工程師,他與Jeff Dean長達數十年的「結對編程」(Pair Programming)合作更是矽谷傳奇;在他的職業生涯中,主導設計了Google File System (GFS)、MapReduce以及Protocol Buffers等核心基礎設施,解決了網路規模運算的關鍵難題;至今他仍活躍於程式開發第一線(正如文中所述在微型廚房製作濃縮咖啡的身影),持續優化支撐Google所有AI與雲端服務背後的軟體架構,是Google技術帝國中最穩健低調的基石。
Demis Hassabis
Demis Hassabis從少年西洋棋神童與遊戲開發者起家,結合神經科學背景於2010年創辦DeepMind,致力於實現通用人工智慧(AGI);2014年加入Google後,他帶領團隊開發出擊敗人類圍棋冠軍的AlphaGo以及破解生物學難題的AlphaFold,獲得諾貝爾獎級別的科學成就;2023年隨著Google內部AI團隊的整合,他出任新成立的Google DeepMind執行長,負責統合研究資源與算力,主導Gemini模型的研發與迭代,是Google在當前AI軍備競賽中的最高指揮官。
Highlight
1.
我總是強迫自己這樣做。雖然我們身處當下,在一個發展迅速、需要快速迭代的產業工作,我也很享受這種節奏,但能夠退後一步進行長期押注,並且在這段時間內非常專注於這個長期賭注,是非常重要的。
2016 年我希望整間公司轉向 AI 優先(AI first)。促成這一決定的很多因素是 2012 年 Google Brain 著名的貓識別論文,那是圖像識別的突破。2014 年我們收購了 Google DeepMind。2016 年 1 月是 AlphaGo 的時刻。很多人沒注意到,我們在 2016 年 5 月宣布了我們的第一代 TPU。當時我就很清楚,看到這一切,我們即將經歷另一次平台轉移。這就是建立 Google 成為 AI 優先公司的全端(Full Stack)賭注。從那時起,我們取得了許多進展,包括 Google 產出的 Transformer 架構,我們將其應用於 BERT 和 MUM 以改善 Search,並推出了 Google Photos 等產品。
但顯然,隨著生成式 AI 的時刻到來,我意識到這個機會窗口更大了,人們已經準備好大規模使用這項技術。不論是消費者還是開發者都是如此。所以我們該如何應對?對我們來說,這意味著啟動 Gemini 專案,跨越 Google Brain 和 Google DeepMind,並決定將團隊合併為 Google DeepMind。我們大幅增加了在基礎設施、資料中心、TPU 和 GPU 上的投資。
接著是讓公司以更快的節奏運作。一旦你擁有了技術,並且 GDM 團隊開始發布 Gemini,這過程中有你也參與了很大一部分的推動,現在的問題是如何確保它體現在我們所有的產品中。有許多產品接觸數十億用戶,如何讓 Search 利用這些模型的能力進行迭代?這就是我們的旅程。
你可以退一步理解這個框架,這非常令人興奮,因為當你採用全端方法時,每一層的創新都會貫穿到最上層。這就是我跟人們解釋預訓練(pre-training)時說的,DeepMind 的預訓練在 Gemini 模型中效果這麼好,是因為後訓練(post-training)和強化學習(RL)就像是底層能力的加速劑。
2.
Logan Kilpatrick:
在 Creating Canopy 辦公室裡有一個微型廚房(MK),那是 DeepMind 很多活動發生的地方。每次我在那裡,儘管 Google 是如此巨大且全球化,那個藍色的 MK 讓 Google 感覺很小、很親密。這讓我想起了早期的 Google。
Sundar Pichai:
我去那裡很頻繁。你會看到 Sergey 在那裡,Jeff 和 Sanjay Ghemawat 還在寫程式,他們在那裡做濃縮咖啡。沒有什麼比看著人們在那個微型廚房製作濃縮咖啡的精確度更能體現我們的文化了。我絕對不敢在那裡做濃縮咖啡,雖然我知道怎麼做一杯好咖啡,但在那群人面前我感到有點膽怯。
3.
Google 是一家雲原生公司,但我們當時並沒有完全對外提供服務。那是一個大規模的賭注。Waymo 也是一個長期賭注,這些事情需要時間,我認為我們現在看到了 Waymo 的轉折點。
量子運算是一個驚人的賭注。我認為大約 5 年後,我們會像今天對 AI 一樣對量子運算感到無比興奮。但我一直在思考那個時間框架。一個例子是兩週前的 Project Suncatcher,我們宣布將在太空建立資料中心。顯然這是個登月計畫(Moonshot)。今天看起來有些瘋狂,但當你真正退一步設想我們將需要的運算量時,這就開始變得合理,只是時間問題。
4.
Logan Kilpatrick:
我知道你偶爾也會 Vibe Code。我很好奇你如何看待這個 AI 建設者的時刻,而不僅僅是傳統軟體工程師能構建東西。
Sundar Pichai:
這是個多麼令人興奮的時刻。這就像網際網路讓部落格出現,許多人成為了作家;YouTube 讓許多人成為了創作者。在程式設計方面你也能感受到這一點,即使在 Google 內部,提交第一次 CL(Code List/程式碼變更)的人數急劇增加。
這是因為這些工具讓它變得更容易上手。也許你是產品行銷人員,你有個想法。過去你會描述它,現在你也許會稍微 Vibe Code 一下並展示給人們看。我剛和團隊裡的一個人聊天,他不會寫程式,但試著教兒子西班牙語動詞變化,他就用 Gemini 3 一次生成(one-shot)了一個動畫 HTML 頁面來向兒子解釋。
我以前常說關於 Waymo 的事:記住這是 Waymo 開得最差的時候,它只會變得更好。這也是我們正在做的所有工具的版本。用 Gemini 3 和 AI Studio 進行 Vibe Coding,既令人驚嘆,同時也是它表現最差的時候。這兩者同時為真。這意味著未來會有很大的進步。
沒有留言:
張貼留言