GCP

訂閱 Facebook Group 的訊息：自建 RSS 伺服器

Ken Chen

08 Dec 2019 — 7 min read

feedly 是一款 Web RSS 訂閱服務，自從 Google Reader 2013 年停止服務後，我就一直使用它，但隨著社群媒體像 Facebook 或 Twitter 流行，訊息的樣貌也改變很多，最痛苦的就是在 Facebook 跟人互動，結果這些訊息都要透過 Facebook 動態來 Follow，等同於變相洗版，何況 Facebook 有自己的演算法，會篩掉它認為你沒興趣的訊息。

這幾天被 Facebook 洗版洗到受不了，外加漏掉一則重要訊息，終於忍無可忍決定找一個新的訂閱方式，但偏偏 Facebook 本身不提供 RSS 訂閱服務，只好土法煉鋼，自己想辦法。

本文會用 tweeper + GCP + feedly 來完成對 Facebook 公開頁面的訂閱。讓這些消息能更好地被管理。

Fetch RSS

要訂閱消息，就要有消息來源，我們用 tweeper 來抓取 Facebook 並轉換成 RSS，這是一款 Linux 工具，首先安裝

sudo apt-get install tweeper

使用方式非常簡單，在後面跟著 Facebook 的公開頁面

tweeper https://www.facebook.com/groups/cloudnative.tw/

然後在 stdout 中，就能看到抓取的資料

<?xml version="1.0"?>
<rss version="2.0" xml:base="https://facebook.com">
    <channel>
    <generator>Tweeper</generator>
    <title>Biz</title>
...

RSS 使用 XML 格式來發佈消息，這個消息文件稱為 RSS feed。RSS Reader 就是抓取這些 feeds 的 URL 來訂閱。

Install Apache

抓取下來的 feed 要給外網存取，因此需要有個網頁伺服器，我們使用最常見的 apache

sudo apt-get install apache2

安裝好後，apache 會用 80 port 提供 HTTP 服務，相關的文檔放在

/var/www/

在瀏覽器中輸入對應 IP，可以看到 apache 的畫面

當現在有一份文件需要對外提供時，可以放到 /var/www 中，外部就能得到這份文件。

Register a Domain Name

因為資安考量，我們不希望將內網曝露到外網中，想在外部架設新的 Server 來提供服務，為了方便 RSS Reader 能找到 Server Address，還需要有個 Domain Name，也就是平常說的網址，這個網址能對應到自行架設的 Server Address。Domain Name 可以向供應商購買，像 Google Domains 就有提供這個服務，價格是 20$/Year

但我們先用免費的 Domain 來測試，交大有無償提供這項服務

註冊並登入後，在網域管理的標籤下，可以新增子網域，輸入自定義的網域名稱

並在 DNS 管理中新增紀錄，輸入名稱與 IP，即可完成申請。如果已經有 GCP 的，可以在 IP 填入 GCP 的 External Address，如果還沒有，先進行下一步，取得 GCP 的 IP。

Set GCP

申請好網域後，就是要架 Server 了。外部 Server 可以用 GCP 架設，具體流程是進入 GCP，開好 VM，安裝需要的軟體，如果不知道怎麼使用 GCP，可以參考前面的文章，GCP 也有提供 apache 的安裝說明

開通 VM 時，要記得將 Firewalls 的 Allow HTTP traffic、Allow HTTPS traffic 兩項打勾，GCP 才能提供 HTTP 跟 HTTPS 的服務。

VM 設完來建立工作目錄。在家目錄底下建一個 rssfeed 資料夾，將輸出的 RSS feed 放到這個資料夾中。接著到 /var/www/html 下創建一個連結到 rssfeed，這樣一來，即使沒有管理者權限，也能在家目錄下管理檔案

mkdir rssfeed && cd rssfeedtweeper https://www.facebook.com/groups/cloudnative.tw > cloudnative.tw.xmlcd /var/www/htmlsudo ln -s ~/rssfeed ./rssfeed

完成後還要修改網路設定，到網路服務點選 Cloud DNS

建立區域，將 DNS 名稱，就是前面步驟申請的網域名填入

外部就可以用 URL 來使用 GCP 的服務了。

現在用 feedly 訂閱剛剛製作完成的 RSS feed，打開 feedly，點選側欄的「+」號，進入探索頁面

在搜尋欄中填入 RSS 的網路位置，例如

http://example.nctu.me/rssfeed/cloudnative.tw.xml

就能在 FEEDS 的訂閱項目中看到訊息啦

是不是很有成就感！

Update RSS Periodically

雖然能用 feedly 訂閱 RSS 了，但 RSS 需要定期更新，feedly 才有最新的資料能抓。我們這邊利用 Linux 的自動執行程序 cron 來做這件事。

先將執行的指令寫成腳本，打開 GCP 的 VM，輸入

mkdir cronscript && cd cronscript
vi update_fb_group.sh

內容是

tweeper https://www.facebook.com/groups/cloudnative.tw > ~/rssfeed/cloudnative.tw.xml

然後要讓 VM 能依照排程，自動執行這支腳本，因此需要使用 cron

crontab -e

打開 crontab 後有範例，依照設定定期執行的時間後，就會定期執行預設的腳本

# m h  dom mon dow   command
0 */1 * * * /home/ken/cronscript/update_fb_group.sh

第一行的 0 表示 0 分時執行，第二行的 */1 表示每小時執行，最後的 command 表示需要執行的指令。

如此一來，服務架設完成，我們有正式的 RSS feeds 了。

小結

讓我們來看看 feedly 抓資料的速度

該筆資料在 2019/12/07 14:58:24 發表，到 2019/12/08 11:17:51 時抓進 feedly，需要快一天，呃，好慢。因為我們的 cron 是每小時更新，速度慢純粹是 feedly 的問題了，依照 feedly 官方的說法，fetcher 是一小時左右抓取一次，可能它有自己的演算法，會再根據每個 feed 的活躍度修改抓取頻率？

且不管速度，至少這樣一來，我們能方便管理訊息了。我統計過，自己一天在 FB 的訊息量大約是 20+，有 feedly 能協助管理訊息後，Facebook 終於可以回歸到乾淨的版面了。

Reference

GCP

Weekly Issue 第 27 期：Nvidia 收購 Groq

從 Windsurf 的案件後，我一直在想，新創成立時，支持創辦人的早期員工與投資人，是不是能得到合理的報酬？Groq 收購案給出很多細節，告訴我們即使是 Acquhire，也還是能盡可能公平。改變世界很重要，但使用的方式也很重要。 🗞️ 熱門新聞 Nvidia deal a big win for Groq employees and investors Groq 收購案的消息出來後，我關心的事情是：這跟 Windsurf 的案子有什麼不同？早期投資人跟團隊有得到回報嗎？先講結論：如果消息正確，該得到的報酬都有得到，皆大歡喜。但我覺得 Acquhire 存在太多灰色地帶，應該要納入監管，不是每家收購發起者跟創辦人都有同樣的素質。按照 Axios 的說法，輝達付出的 200 億將被視為估值分配給股票持有人，90% 員工會加入輝達，到期股票會變現，

Weekly Issue 第 26 期：AI 批評指南

最近在讀《高效槓桿力》，書中提出一套變革管理框架：「尋找關鍵支點，重新配置資源。」當然，書裡給出很多案例，說明如何找到支點，只是我同時在想，如何將他們帶到我面對的情境呢？ ✨ 科技觀點 Pluralistic: The Reverse-Centaur’s Guide to Criticizing AI 看到有人非常認真討論事情，即使是批評 AI，都會讓我有興趣。附上一些我的觀點： 1) 成長型公司聽起來很美好，每個人都會想待在那，但當它變成前提時就是另一回事了。很多決策都會以成長為基礎，最後就是投資人跟企業都沒辦法接受不成長的代價。 2) 常常在爭論 AI 是否會取代工作，看的是 AI 的兩個面向，賦能與自動化，哪個會更符合當前情境。贊同賦能的人會認為 AI 帶來生產力的解放，並創造價值，可是實際上呢？ 3) 很多人提過 AI 的解壓縮 / 壓縮特性，特別是在履歷或信件應用。

Weekly Issue 第 25 期：Slack 基礎設施爭議

因為地緣政治議題，我們會關心資料存放的地點是否足夠安全，即使當使用者被盯上，他仍然可以放心資料足夠隱密。這也是為什麼當網路上傳出 Slack 台灣的資料轉移到阿里雲時，會引起爭議的原因。 Slack 已經出面澄清並無此事，這也讓我們反思，當軟體業面臨這類公關危機時，應該要揭露到什麼程度。 🗞️ 熱門新聞 Slack 在臺服務將移轉至中國？ Salesforce：臺灣用戶使用全球基礎設施，與阿里巴巴無關前幾天 Salesforce 傳出要將 Slack 台灣資料轉移到阿里雲，立刻引起一陣討論，有 Salesforce 的人出來澄清，說沒有這回事。「台灣市場一直以來都是採用 Global Infrastructure 全球基礎設施。簡單說，台灣用戶的資料是儲存在美洲或亞太區（如日本），跟中國的阿里雲在物理和邏輯上都是完全切開的。」讓我有興趣的是，Salesforce 沒有說他們是用哪個雲平台。我們以前有次遇到類似情況，也討論到是否揭露使用平台。當時我持反對意見，認為只需要揭露「使用全球基礎設施」已經夠了，頂多說非中國廠商的服務就好，不需要也不應該說明具體是哪個。

Weekly Issue 第 24 期：網路的精神高地

前陣子去了雪梨一趟，跟布里斯本或台北都形成有趣的對比，旅行中也不斷在想，一座城市如何發展出自己的文化？這有點像是網路平台如何形成聚落，而又如何消亡。很喜歡本期談知乎的一篇文章，理想主義的光輝是最吸引人的，我常在想，有沒有辦法將那座「看不見的城市」帶到真實世界中。 🗞️ 熱門新聞 A ChatGPT prompt equals about 5.1 seconds of Netflix 看到 Simon Willison 提到，如果 Sam Altman 的資訊是對的，每個 LLM 提問相當於 5.1s 的 Netflix 影片耗能。計算的需求讓輝達跟台積電挖到金礦，那電力需求又會讓誰挖到金礦呢？ ✨ 科技觀點我们失去的不只是知乎，而是中文互联网的精神高地「那时的知乎，更像“思想沙龙”，而非“内容平台”。」昨天跟朋友聊天，