Weekly Issue 第 25 期:Slack 基礎設施爭議
因為地緣政治議題,我們會關心資料存放的地點是否足夠安全,即使當使用者被盯上,他仍然可以放心資料足夠隱密。這也是為什麼當網路上傳出 Slack 台灣的資料轉移到阿里雲時,會引起爭議的原因。
Slack 已經出面澄清並無此事,這也讓我們反思,當軟體業面臨這類公關危機時,應該要揭露到什麼程度。
🗞️ 熱門新聞
Slack 在臺服務將移轉至中國? Salesforce:臺灣用戶使用全球基礎設施,與阿里巴巴無關
前幾天 Salesforce 傳出要將 Slack 台灣資料轉移到阿里雲,立刻引起一陣討論,有 Salesforce 的人出來澄清,說沒有這回事。
「台灣市場一直以來都是採用 Global Infrastructure 全球基礎設施。簡單說,台灣用戶的資料是儲存在美洲或亞太區(如日本),跟中國的阿里雲在物理和邏輯上都是完全切開的。 」
讓我有興趣的是,Salesforce 沒有說他們是用哪個雲平台。我們以前有次遇到類似情況,也討論到是否揭露使用平台。當時我持反對意見,認為只需要揭露「使用全球基礎設施」已經夠了,頂多說非中國廠商的服務就好,不需要也不應該說明具體是哪個。
如今回來看這件事,從政治來說,也許還是應該揭露使用的平台?至少能立刻平息輿論(儘管這件事沒這麼單純,畢竟現在很多混合雲)。但當時沒想這麼多,只覺得太荒謬了,只要你說得不夠徹底,你就有問題,這條線應該要劃在哪呢?
✨ 科技觀點
AI detection tools cannot prove that text is AI-generated
有陣子很流行一些 GenAI 識別的小技巧,像是看句子中有沒有「是…而不是…」。我因為不想被當成是用 AI 寫的,寫東西時會刻意避開這種有 AI 味的句子。
後來想通了(或者說是覺得太麻煩了),被當成 AI 就被當成 AI 吧,反正連 OpenAI 自己的工具都無法保證能測出是否由 AI 產生了。原因也很單純:「因為 AI 偵測工具的核心想法——人類寫作和 AI 生成的寫作之間存在一種本質差異——根本上就是錯誤的 」
這不是說偵測是錯的,在很多場景中,真實性依然有其必要,但我們不應該把真實性跟內容劃上等號。想想古代畫作,我們不會從技法來看它是否是真跡,而是從顏料的存在時間來判斷。也像 Sean 講的,在 AI 時代,單純用偵測工具來判斷是否是 AI,可能會傷害真正試圖創作的人。
📌 工程實務
Queues Don't Fix Overload
「我們從不降低負載,因為那會讓利害關係人不高興,也從不考慮背壓。通常系統裡的反壓是隱含的:就是慢。」
在看講 Queue 的應用場景時看到這句,反思自己好像也常遇到類似問題,當你的網站 RPS 是 500,而且不斷增加,開始對系統造成影響時,幾乎不可能要求要降低負載(意思是,讓使用者看見「網站超過負載」的訊息)。讓背壓顯現倒有可能,但更常見的是,我們讓背壓成為一種隱性代價:網站變慢。
這不是 Queue 不當使用的問題而已,Queue 的引入會讓問題更複雜沒錯,因為更難從端到端追蹤問題根源。根本問題在於非功能性規格有多少,為 C10K 設計的網站是無法應付 C100K 的需求。而量變造成質變這件事不符合人的思維慣性。
Harbor GC 问题
如果想知道 GC 在工作中會怎麼用到,這裡有個 Harbor 的例子 😄
有趣的點是,另一個負責人用的方式是複製一套 Harbor 群集,並用反向代理讓請求指向新群集,只有當新群集沒有資料時,才對應到舊群集。這跟冗餘架構的設計概念很接近。文中說這是用維運手段來解決,我倒覺得更像架構思維。