Weekly Issue 第 22 期:Google 發布 Nano Banana Pro

最近大新聞要算 Cloudflare 出問題,以及 Google 發布新的 AI 模型。新的 Nano Banana Pro 不管在一致性還是文字呈現,都出乎意料地好。如果 Google 真的能在這場 AI 大戰中笑到最後,這一定會成為商業競爭的經典案例。


🗞️ 熱門新聞

How we’re bringing AI image verification to the Gemini app

Google 幾天前發布的 AI 模型太強了,各種錦上添花的稱讚就不說了,在 Simon Willison 的 Blog 看到,Google 設計出防偽機制,避免假圖到處跑。

機制有兩種,一種是在生成的內容中,插入人眼不可辨識的 SynthID,看起來只要 Gemini 產出都會帶;另一個則是放上人眼可辨識的浮水印。

AI transparency 會是很重要的非功能性要求,這點必須稱讚 Google。


✨ 科技觀點

Dead Internet Theory Gains Traction as AI Content Surges Online

這篇討論 Dead Internet,意思是現在的網路活動多來自假裝成人類的機器人,像是一堆殭屍在網路上晃來晃去,這些殭屍會改變網路的生態。

這跟我認為的「私人社群」趨勢相符,因為內容貶值,未來(或者現在)我們會需要知道內容為真。這「真」的意思不是說內容正確,否則大多主觀判斷的內容都不能為真,「真」的意思是你知道這內容來自哪裡,你知道自己在跟誰說話。

從產品面向來說,未來的社群會需要更著重於 user profile,個性化是一個,成就也是一個,或者不單純是 metrics 的維度,還有 trace 維度,讓你知道這名成員為社群做出哪些貢獻。

網路不會消失,但它會是一個不同的型態。

This is your brain without sleep

又是一個關於睡眠的研究。

我以前常常熬夜,因為靈感都在晚上才出現,我喜歡夜深人靜可以專心的感覺,直到看了《為什麼要睡覺?》,開始覺得還是相信科學好了。

大概到最近,才開始有比較正常的睡眠時間吧,深夜趕報告真的會讓人覺得熱血沸騰,希望不要再發生了 😂

道歉,是把自己縮小的語言

盡量避免過度客氣是我還在學的事。

記得有次跟日本人共用浴室,我沒注意,用了他的洗髮精,當時我先道歉,沒想到他反而很不好意思,說我不用在意,兩個東方人在那邊客氣來客氣去。

我現在道歉前都會想起不知道在哪看到的句子,講說有人會將自己縮小,好像怕自己發出的光會刺傷別人,我讀到時覺得非常溫柔,同時又在想:為什麼要這樣為難自己呢?

The Greatness of Text Adventures

在這個 LLM 時代談 Text Adventure Game 似乎有點復古,但還是有些有趣的點,像是最早的遊戲是利用 parser 解析輸入,再給予設計好的回應,而遊戲樂趣就是找出各種看似不合理,實則峰迴路轉的輸入項。

因為我喜歡類銀河戰士惡魔城,直接想到「探索」。

從遊戲設計的角度來說,最早的設計容易帶來糟糕的體驗,玩家不斷猜測某個字,但一直猜不到,只會覺得挫折。近代也有像 Her Story 這樣改寫 Text Adventure 邏輯的遊戲,但畢竟還是概念居多,多數的現代遊戲改成點擊或選擇(例如逆轉裁判),反而能帶來更多樂趣。

回到 LLM 的議題上,這也是聊天式 AI 產品的問題,除非你的目的就是聊天,否則聊天機器人式的設計不會是好設計。

Tech things: Robotics has its GPT2 moment, Data has its Oil Moment

為什麼 AI 在問答、開發程式、繪圖都已經有很不錯的表現,但在實際生活,例如打掃,好像還是很笨拙呢?一個可能的原因是:資料不夠。

如果作者是對的,那確實有很大的想像空間,資本可以轉成資料(利用群眾外包),資料可以轉成智慧,然後我們就能解決真實生活中的各種問題。當然我們也很容易想到,Google 手中有各種現成的資料……

LLM 給人最大的啟發,可能是有時候量變真的能造成質變。

On Talent

這篇談天賦的文章寫的真好,不只是內容的好,還包括組織方式,可以想像作者平常讀過很多資訊,才能這麼輕鬆不費力將摘錄放到對的位置(對的位置意思是,不是為了吸引人而耍的花招,而是內容要求如此)。

我受渥特班雅明影響很深,大家都知道班雅明喜歡引用各種資料,那是他的創作方法論,如果班雅明到這時代,他會成為一名好的創作者嗎?看情況,他的頻次低而且不固定,可是洞察非常深刻。如果是以月為單位,他有機會表現得比較好。

這也是作者在講的天賦,有時候需要調整客觀條件來配合你的天賦,因為每個人的天賦都不同,別人的方式終究只能成為某種參考。


📌 工程實務

The metrics product we built worked — But we killed it and started over anyway

Sentry 技術長寫了篇關於 Sentry 如何建構 Metrics 產品的文章,超精彩,推薦閱讀。

Sentry 原本打算只用「時間」來關聯訊號,Metrics 會用預先聚合的方式處理好,等到要看時叫出來,例如,他們會紀錄這 15 分鐘內的平均延遲是多少,所以你可以有 1:15、1:30、1:45 的資料。

問題是,如果你只想看特定 server 的 Metrics 呢?這就帶來「高基數」問題。也是 Charity 在她文章中不斷強調,但我一直沒很好理解的點。開發者為了除錯,通常會想紀錄更多的 metadata,這些都是成本。因為要預處理,等於每個 metadata 都要額外開一串時間序列。

最後 Sentry 選擇儲存原始事件,並使用他們的分析平台來進行即時聚合,我不確定他們如何解決效能問題,但我猜是利用取樣跟索引的設計。Anyway,我想講的是這些決策過程還有設計思路,真的是太有意思了,現代化的遙測基本上就是這議題。

The Declarative configuration journey: Why it took 5 years to ignore health check endpoints in tracing

看到 Otel 解釋他們為什麼花了 5 年才實作路徑忽略功能。主要原因是,他們原本用 Env 來配置,隨著功能越來越複雜,他們開始要用 yaml 進行配置,而要設計出有共識的精確語意又很困難。

這是想成為標準的專案獨有的困難,當其他人依賴你的介面時,頻繁變動會讓使用者不知所措,同時帶來麻煩的爭論。它不是技術層面的問題,而是治理問題。

James Shore: The Accountability Problem

哇,這場演講超讚,我太常被問到「這個功能要開發多久」了,儘管我知道這個問題沒有意義,但另一方面,我也知道別人會問不是因為他無聊,而是因為如果不知道多久,他就無法規劃。

在某個意義上,我知道自己應該要更關注生產狀態,不是說交付的功能數量,而是每項部署會花掉團隊多少時間,團隊平常因為哪些事情而分心,還有交付的品質如何。這些事表面上跟開發時間無關,可是他們是紮紮實實的工程管理議題,不把這些做好,工程團隊會沒辦法承諾任何事。

回到務實層面,工程負責人「必須」說出一個時間,但你不該讓時間成為關注重點,而這 "requires that play a political balancing act",也如演講說的,會需要別人的支持,也會得罪很多人,這是 engineering management 好玩跟痛苦的地方。

Your data model is your destiny

這篇講建模的概念跟 DDD 是互通的,都是從領域出發,但它列出的例子太有說服力了,有興趣可以看看。

Anyway,雖然他講得輕鬆,可是最難的就是建模,例如社群,應該要以什麼為第一公民呢?有時候是訊息(通常是論壇),有時候是空間(例如 Discord),有時候是創作者(例如 Onlyfans)。

Read more

Weekly Issue 第 27 期:Nvidia 收購 Groq

從 Windsurf 的案件後,我一直在想,新創成立時,支持創辦人的早期員工與投資人,是不是能得到合理的報酬?Groq 收購案給出很多細節,告訴我們即使是 Acquhire,也還是能盡可能公平。 改變世界很重要,但使用的方式也很重要。 🗞️ 熱門新聞 Nvidia deal a big win for Groq employees and investors Groq 收購案的消息出來後,我關心的事情是:這跟 Windsurf 的案子有什麼不同?早期投資人跟團隊有得到回報嗎? 先講結論:如果消息正確,該得到的報酬都有得到,皆大歡喜。但我覺得 Acquhire 存在太多灰色地帶,應該要納入監管,不是每家收購發起者跟創辦人都有同樣的素質。 按照 Axios 的說法,輝達付出的 200 億將被視為估值分配給股票持有人,90% 員工會加入輝達,到期股票會變現,

By Ken Chen

Weekly Issue 第 26 期:AI 批評指南

最近在讀《高效槓桿力》,書中提出一套變革管理框架:「尋找關鍵支點,重新配置資源。」當然,書裡給出很多案例,說明如何找到支點,只是我同時在想,如何將他們帶到我面對的情境呢? ✨ 科技觀點 Pluralistic: The Reverse-Centaur’s Guide to Criticizing AI 看到有人非常認真討論事情,即使是批評 AI,都會讓我有興趣。 附上一些我的觀點: 1) 成長型公司聽起來很美好,每個人都會想待在那,但當它變成前提時就是另一回事了。很多決策都會以成長為基礎,最後就是投資人跟企業都沒辦法接受不成長的代價。 2) 常常在爭論 AI 是否會取代工作,看的是 AI 的兩個面向,賦能與自動化,哪個會更符合當前情境。贊同賦能的人會認為 AI 帶來生產力的解放,並創造價值,可是實際上呢? 3) 很多人提過 AI 的解壓縮 / 壓縮特性,特別是在履歷或信件應用。

By Ken Chen

Weekly Issue 第 25 期:Slack 基礎設施爭議

因為地緣政治議題,我們會關心資料存放的地點是否足夠安全,即使當使用者被盯上,他仍然可以放心資料足夠隱密。這也是為什麼當網路上傳出 Slack 台灣的資料轉移到阿里雲時,會引起爭議的原因。 Slack 已經出面澄清並無此事,這也讓我們反思,當軟體業面臨這類公關危機時,應該要揭露到什麼程度。 🗞️ 熱門新聞 Slack 在臺服務將移轉至中國? Salesforce:臺灣用戶使用全球基礎設施,與阿里巴巴無關 前幾天 Salesforce 傳出要將 Slack 台灣資料轉移到阿里雲,立刻引起一陣討論,有 Salesforce 的人出來澄清,說沒有這回事。 「台灣市場一直以來都是採用 Global Infrastructure 全球基礎設施。簡單說,台灣用戶的資料是儲存在美洲或亞太區(如日本),跟中國的阿里雲在物理和邏輯上都是完全切開的。 」 讓我有興趣的是,Salesforce 沒有說他們是用哪個雲平台。我們以前有次遇到類似情況,也討論到是否揭露使用平台。當時我持反對意見,認為只需要揭露「使用全球基礎設施」已經夠了,頂多說非中國廠商的服務就好,不需要也不應該說明具體是哪個。

By Ken Chen

Weekly Issue 第 24 期:網路的精神高地

前陣子去了雪梨一趟,跟布里斯本或台北都形成有趣的對比,旅行中也不斷在想,一座城市如何發展出自己的文化?這有點像是網路平台如何形成聚落,而又如何消亡。 很喜歡本期談知乎的一篇文章,理想主義的光輝是最吸引人的,我常在想,有沒有辦法將那座「看不見的城市」帶到真實世界中。 🗞️ 熱門新聞 A ChatGPT prompt equals about 5.1 seconds of Netflix 看到 Simon Willison 提到,如果 Sam Altman 的資訊是對的,每個 LLM 提問相當於 5.1s 的 Netflix 影片耗能。 計算的需求讓輝達跟台積電挖到金礦,那電力需求又會讓誰挖到金礦呢? ✨ 科技觀點 我们失去的不只是知乎,而是中文互联网的精神高地 「那时的知乎,更像“思想沙龙”,而非“内容平台”。」 昨天跟朋友聊天,

By Ken Chen