Weekly Issue 第 10 期:AI 機器人正造成網站負擔
隨著 LLM 變成日常的一部分,它們也在改變原有的網路生態。Fastly 的報告顯示,AI 機器人每分鐘可對網站發起高達 39K 次請求,日後造訪網站的,可能大多是機器人,而不是真人。
🗞️ 熱門新聞
Fastly warns AI bots can hit sites 39K times per minute
繼上次 Codeberg 的新聞後,Fastly 出報告指出 AI 機器人正造成網站營運負擔。
大多觀點延續幾個月來的趨勢:「網站負載增長主要並非來自人類訪客,而是代表聊天機器人公司運作的自動爬蟲與抓取程式。 」值得注意的是,AI Fetcher 的數量也在增加中,我猜這多少暗示了用戶搜尋資料的行為正在變化。
Meta 占了所有 AI 流量的 52% 🙄 ,相對下 Anthropic 只佔 3.76%。
也訪問了 Anubis 的開發者,這句話很重要:「這是監管層面的問題。政府需要介入,對這些破壞數位公共利益的 AI 公司處以足以威脅其生存的巨額罰款,並要求它們賠償受損害的社群。諷刺的是,多數這些 AI 公司都依賴著它們正在摧毀的社群。」
有些話還是開發者才能說得這麼直接。
Linux Reaches 5% Desktop Market Share In USA
看到消息說 Linux 在美國的 Desktop 市場突破 5%,有點驚訝。
文中列出很多因素,例如 Windows 的隱私問題,但我還是很難想像 Linux 會成為主流,在印象中,Linux 很強調動手能力,這仍然有相當高的門檻。
看 Statcounter 說明,他們是在網站上埋追蹤,看訪客的 OS 是什麼。我自己網站的流量大多是來自 macOS,這應該是開發者習慣用 mac 的關係。
Inconsistent Performance
同樣都是使用 gpt-oss-120b,你呼叫的跟別人呼叫的同樣聰明嗎?
有報告指出,不同供應商會造成不同結果,想想也很合理,因為他們怎麼設定 LLM 沒人知道,可能給的資源緊了點,預設參數保守了點,模型也就變笨了。
依照 8/20 的資訊,Google Vertex 跟 Amazon 的效果看起來不太優。
✨ 科技觀點
AI Doesn't Lighten the Burden of Mastery
這幾個月關於 LLM 對工程師的影響有很多討論,我在意的是技藝的變化。
「虛假的精通,就是把看似正確的語法誤認為真正的理解。 」
最近使用 Google 的 imagen4 來產生圖片,發現不論如何下 prompt,都得不到我想要的 vibe,原因不是因為 Google 的模型有問題,而是因為我沒辦法給出對的需求(即使我只是想要一張大頭貼 🤣 )。
The Enterprise Experience
以前同事曾經問我:「大企業跟小企業差在哪?」我說:「大企業比較講究制度。」想想別人應該聽不懂,有點不好意思:「有些事你親自體驗才會知道。」
現在這篇非常傳神說明差別,在大企業,你得花精神理解組織如何運作,組織架構圖比軟體架構圖還重要。替公司省錢不如替部門省錢。大企業內部有一套自己規則,有次跟我合作的 PM 感嘆到:「這裡的人好像生活在世外桃源中。」這不是稱讚。
小企業也未必沒有這些問題,只是小企業乾脆的是,通常問題稍微嚴重點,會直接倒閉。這是簡單有效的反饋迴路。
Why It's OK to Block Ads
在 HN 看到的討論,有人認為廣告已經造成倫理問題,你以為自己是瀏覽網站的消費者,殊不知從經濟的角度來看,你是付出注意力的生產者。
我對商業模式如何影響產品很有興趣,因為產品倫理的大多問題,不是主導者是否有心向善,而是他們並不在意(Careless),主導這些的不是人,是商業模式。
我會安裝 F.B. Purity 來剔掉 FB 的廣告,我也不喜歡到處發送的 EDM 跟頻繁的 Notification。
面試的終極大魔王:一個問題推翻取錄決定
這篇談面試的關鍵題有點意思,某程度也可以拿來給面試官看看(?)
我沒做過成長,不太確定能不能這樣問。但我的確會因為人選在他的履歷上寫 99.9% 的 uptime,而問他是如何設計系統。問的也是他的動機、策略、以及有沒有遇到實務上的 gap。
最後那句話講的很好:「你不用講得最漂亮,但一定要講得真實、講得出故事脈絡,講得出思考過程。」主要還是想知道,對方到底會怎麼思考。
Do Things that Don't Scale
重溫 Paul Graham 的「做無法規模化的事」,跟這幾年的經驗對照,滋味又不同了。
印象中是 Graham 喊出 Startup = Growth,因此也不意外,文章是從成長的角度來談,幾個概念都可以直接拿來實踐,像手動替用戶 onboarding,專注在一個很小的群體,以及不要太早規模化。
「以尚未自動化的方式解決用戶問題可能會有點令人不安,但比起那種更常見的情況——你有自動化卻還沒有解決任何人的問題——這種不安感要小得多。 」
單純就這點,無論公司是否追求成長,道理都一樣。但成長會促使你看向更大的市場,反而不容易做到這些事。
📌 工程實務
Container-aware GOMAXPROCS
Go 1.25 新增功能,讓 GOMAXPROCS 可以套用容器的 CPU 限制為預設值。
簡單說呢,如果你使用 k8s 編排容器,可能會限制 CPU 的使用,但要是沒刻意調整 GOMAXPROCS,會讓 Go 以為可用的核心是宿主機的核心,然後超過配置,1.25 讓 Go 會去使用容器編排的設定當 GOMAXPROCS 預設值。
有意思的是這句話:「節流是一種粗暴的限制機制,用於控制可能超出 CPU 限制的容器:它會完全暫停應用程式在節流期間剩餘時間的執行。節流週期通常為 100 毫秒 」原來節流是這樣運作的呀,那完全可想像,當配置不匹配時,很容易讓應用程式被停掉。
nginx Announces Support for ACME
nginx 宣布支援 ACME,以前要嘛就是手動換,要嘛就是用 Certbot,現在可以省點麻煩了。
有 caddy 後我都用 caddy 了(前同事推坑),設定更簡單,也是 Go 生態系,沒理由不用,但 nginx 能支援還是好事,畢竟使用者更多,對 https 也更有影響力。
看起來目前還沒支援 DNS-01,只有 HTTP-01,也還沒有 wildcard,可以再觀察看看。