Weekly Issue 第 16 期:Anduril 的 MVP

近期嘗試降低 AI 相關選文,主要是因為我在閱讀時,不容易判斷內容是正確還是錯誤。本次選的「AI Evals 大辯論」在這點上就做得很棒,正反意見並陳,讓讀者知道自己哪些論點也有人支持,哪些論點具有爭議。


🗞️ 熱門新聞

The Amusement Park for Engineers

原本看是 Anduril 嘀咕幾聲(我對國防工業沒興趣),但看到一半覺得太讚了,推薦所有做產品的人閱讀。

這句話開始點亮我的眼睛:「那座臨時搭建的塔,是我們自掏腰包、為了驗證可行性而做的,幫助攔截了近一千磅的大麻,並導致數十起毒品走私逮捕 」

業界都說要做 MVP,但到底什麼是 viable?沒有 viable 的 MVP 只能稱為 prototype 而已。合作的 PM 有次說的傳神:「別人要樣品屋,但我們只有沒屋頂的牆壁。」

這篇雖然沒有講到 agile,卻做到 agile 的目標。從產品開發到組建 core team 到設定 OKR,能學習的點真的太多。

AI Evals 大辯論: 從 Claude Code 訪談引發的反思

有點晚才看到,這篇關於 evals 的整理好讚。

我只有在 side project 使用 evals,因為「通用的 evals 像『faithfulness』或『helpfulness』是沒用的,你的 evals 必須與用戶問題對齊。 」而對齊這件事不好做,我們當時的產品仍在找 market fit,還沒辦法進行。

這場討論另一個 insight 是,有些人認為 online test 更有意義,這也跟我的經驗類似,以前原廠曾經問我是如何評估 AI 成效,我們當時的方式是,在 AI 上放個 again 的按鈕,如果這按鈕常按,代表使用者可能不是很滿意 AI 的產出。


✨ 科技觀點

年末評核,用決策與結果換 30% 加薪

昨天跟朋友聊天,他提到最近受主管倚重,我有點訝異:「可是你們的方向不是每個星期都在改嗎?這樣你怎麼有辦法做出成績說服主管?」

某部分原因跟這篇主題很像:「數據不等於價值,洞察才是。」我們後來討論,關鍵應該是,雖然方向一直改,可是我朋友都能交出一些 PoC 來驗證方向,讓管理層能進一步下決策,雖然我有點半開玩笑說:「就像是你請 AI 幫你規劃行程久了,就會信賴他。」

我還是覺得不太健康,沒有 outcome 支撐的信賴,放在工作環境還是有點勉強。

Software Design: Tidy First?

現在才發現 Kent Beck 有 Substack 專欄,而且是從 2021 年開始持續到現在。

「到底 Substack 哪點吸引他?Hashnode 更符合開發者的生態呀。」抱著這樣的好奇,翻到這句話:「當我看到一位新訂閱者時,我想要交付一些有價值的內容。 」

接著又翻到另一篇:「我正在面對那些四十歲、甚至五十歲時的恐懼。我有幫手——商業教練、行銷教練,還有 SubStack 的協助。」

字裡行間透露的沮喪讓人驚訝,我想每個人都需要一些存在的理由,而「創作被某些人需要」可以扮演這個角色。

Vibe-Coded Product Success Stories Ain't What They Look

我對 Vibe Coding 還是保有一定距離(應該說,對不熟悉的東西,都保有距離,這是我的壞習慣)。這篇講到幾個我在意的點。

「別小看粉絲群的力量。2000 年代,Joel Spolsky 所涉足的任何事物幾乎都能變成黃金。StackOverflow?有。Trello?有。為什麼?他有忠實的粉絲群 」

在創作者經濟,這是個常見的現象,有時我們在談 Vibe Coding,談的不是產品設計(例如哪些設計能拉高 MAU),而是在看別人演出。前幾天談到開發者行銷跟普通行銷的差別,也許這也是個例證。

What is developer marketing?

看完這篇,忍不住想:開發者行銷跟普通行銷,關注的可能是不同重點。

依照這篇的講法,開發者行銷在於找出「AHA Moment」,然後將它傳達給使用者,宏觀角度來講,這跟 Product Lead Growth 是同樣意思,幫助使用者理解你的產品,然後用它來驅動成長。

而常見的行銷比較像是 Marketing Lead Growth,用廣告跟故事來跟使用者溝通,這當然也能驅動成長,但跟 PLG 是不同道路了。


📌 工程實務

The quality of AI-assisted software depends on unit of work management

這篇算是用 LLM 開發 AI Agent 的一種建模原則:「用 User Story 當成 AI Agent 的邊界。」

挺有趣的,這意味著,你需要很多的 AI Agent(類似於,你需要很多的 API 來完成 User Story),而這些 Agent 間也存在明確的邊界,甚至可能在給 LLM 的 System Prompt 中,會明確說明只有哪些問題是可接受的。

說有趣是因為我不太確定這是不是有效的範式,看原文,作者他們也還在實驗中。

'Make invalid states unrepresentable' considered harmful

「然而,許多大型科技公司——包括我曾任職的兩間公司 GitHub 與 Zendesk——刻意選擇不使用外鍵約束。 」

有點爭議的話題,但內容很有意思:到底約束應該要設計得多嚴格呢?

我曾經設計過內容管理系統,當時嚴格依照狀態機,每個狀態都有對應的動作。如果沒有對應動作,就不能切換。結果遇到原本設計時沒想到的情境,然後要重新設計。

如果用 DDD 建模,理想情況下,領域模型會跟應用程式的模型相匹配,DDD 有項原則是領域的變動引導軟體變動,而不是反過來,但當領域變動很頻繁時,開發成本就會變高(當然,那種情況高的也不只是開發成本了)。

知道 GitHub 跟 Zendesk 沒有嚴格使用 FK,會讓我在不設 FK 時安心一點。

Interface 不是有開就好:從一個 PR 來看抽象化的重要性

很常聽人說依賴反轉,但具體要如何實施?這篇講的就很詳細。

Robert Martin 講 Clean Arch,也是講究抽象行為,獨立實作。依賴反轉的困難點是,如果不知道背後邏輯如何運作,很容易會被實作帶走,導致抽象出來的東西無法套用在其他場景。

就像 PM 要多看產品,了解不同的實作,才能知道它們間該如何抽象。

How I influence tech company politics as a staff software engineer

看了 Goedecke 關於工程師在職場政治的文,跟經驗大致相同,儘管我從來都不喜歡職場政治。

大致上他建議,你應該把工作包裝成管理層的目標,而且最好積極看待這件事,畢竟「無論你做不做,某項計畫都會被支持。但如果你不參與,你就無法掌控那個計畫會是什麼。」

但同樣來自經驗的是,沒有深層理解的、單純包裝的工程計畫,很容易在面臨逆風時陣亡,跟投資股票的經驗類似。要尋求的是合適的投資人,而不是單純想賺政治資本的人。

我以前的主管常常稱呼 GM 為 Investor,後來覺得這個稱呼超貼切。

Read more

Weekly Issue 第 25 期:Slack 基礎設施爭議

因為地緣政治議題,我們會關心資料存放的地點是否足夠安全,即使當使用者被盯上,他仍然可以放心資料足夠隱密。這也是為什麼當網路上傳出 Slack 台灣的資料轉移到阿里雲時,會引起爭議的原因。 Slack 已經出面澄清並無此事,這也讓我們反思,當軟體業面臨這類公關危機時,應該要揭露到什麼程度。 🗞️ 熱門新聞 Slack 在臺服務將移轉至中國? Salesforce:臺灣用戶使用全球基礎設施,與阿里巴巴無關 前幾天 Salesforce 傳出要將 Slack 台灣資料轉移到阿里雲,立刻引起一陣討論,有 Salesforce 的人出來澄清,說沒有這回事。 「台灣市場一直以來都是採用 Global Infrastructure 全球基礎設施。簡單說,台灣用戶的資料是儲存在美洲或亞太區(如日本),跟中國的阿里雲在物理和邏輯上都是完全切開的。 」 讓我有興趣的是,Salesforce 沒有說他們是用哪個雲平台。我們以前有次遇到類似情況,也討論到是否揭露使用平台。當時我持反對意見,認為只需要揭露「使用全球基礎設施」已經夠了,頂多說非中國廠商的服務就好,不需要也不應該說明具體是哪個。

By Ken Chen

Weekly Issue 第 24 期:網路的精神高地

前陣子去了雪梨一趟,跟布里斯本或台北都形成有趣的對比,旅行中也不斷在想,一座城市如何發展出自己的文化?這有點像是網路平台如何形成聚落,而又如何消亡。 很喜歡本期談知乎的一篇文章,理想主義的光輝是最吸引人的,我常在想,有沒有辦法將那座「看不見的城市」帶到真實世界中。 🗞️ 熱門新聞 A ChatGPT prompt equals about 5.1 seconds of Netflix 看到 Simon Willison 提到,如果 Sam Altman 的資訊是對的,每個 LLM 提問相當於 5.1s 的 Netflix 影片耗能。 計算的需求讓輝達跟台積電挖到金礦,那電力需求又會讓誰挖到金礦呢? ✨ 科技觀點 我们失去的不只是知乎,而是中文互联网的精神高地 「那时的知乎,更像“思想沙龙”,而非“内容平台”。」 昨天跟朋友聊天,

By Ken Chen

Weekly Issue 第 23 期:Mastodon CEO 離職感言

電子報本質是種自媒體,儘管我發文前都會確認,還因為能力所限,偶爾還是有沒做好的地方。每次遇到時我都會想,不知道其他自媒體是如何查證的呢? 現代的訊息越來越快,不只是自媒體,很多專業媒體也不見得有完備的查證能力,我猜當內容氾濫,「真實」會變得越來越有價值,最終變成一門生意。 🗞️ 熱門新聞 Explore the independent web Ghost 最新一期的電子報談到他們如何處理「內容發現」的問題。 簡單來說,他們有個內容發現工具 Ghost Explore,如果創作者願意提交自己的網站數據,他們能依照這些網站數據來推薦。再來,他們還會參考 ahrefs 的資料,判斷該網域是否具有高品質。 這比 Substack 發展社群工具,更貼近我對產品的想像。現代內容網站基本都需要演算法,這已經不是要不要,是怎麼設計的問題。 My next chapter with Mastodon Mastodon 的 CEO 即將卸任,他發了篇談談這段時間的心路歷程。

By Ken Chen

Weekly Issue 第 22 期:Google 發布 Nano Banana Pro

最近大新聞要算 Cloudflare 出問題,以及 Google 發布新的 AI 模型。新的 Nano Banana Pro 不管在一致性還是文字呈現,都出乎意料地好。如果 Google 真的能在這場 AI 大戰中笑到最後,這一定會成為商業競爭的經典案例。 🗞️ 熱門新聞 How we’re bringing AI image verification to the Gemini app Google 幾天前發布的 AI 模型太強了,各種錦上添花的稱讚就不說了,在 Simon Willison 的 Blog 看到,Google 設計出防偽機制,避免假圖到處跑。 機制有兩種,一種是在生成的內容中,插入人眼不可辨識的 SynthID,

By Ken Chen