再見Unite,你好fzf.vim

Unite是一個vim的模糊搜尋外掛,透過將模糊搜尋的邏輯和資料來源分離,實現了一個可泛用於各種情境的模糊搜尋框架,例如:檔案搜尋、內文搜尋、git commits等等;加上它作為一個原生vim外掛,幾乎是只要vim能用的地方它就能用,省去不少環境設定的麻煩,過去幾年來它一直在我的開發環境中扮演重要角色。但Unite效能不彰、由於設計上的問題擴充不便,更受不了的是作者Shougo沒事就把一樣的東西一直重寫,而不是好好地維護好一個專案,終於「再次」下定決心換掉 –– 是的,這不是我第一次找,只是過去都沒有成功。

所幸一代新人換舊人,這次很快就找到:fzf。實作品質優秀、效能拔群、設計上擴充容易,加上穩定的維護,用得我老淚縱橫,忍不住就贊助了好幾杯咖啡給來自南韓的作者junegunn。

從進入web3到離開

以區塊鏈為基礎的技術現在有多火紅,相信不需要任何解釋。個人最早的加密貨幣經驗是十幾年前在研究所的時候嘗試買了一千多台幣的比特幣,體驗過整個流程後覺得「喔喔,真的這樣就可以買、可以用了耶,好有趣呢」就把它忘了 –– 對,忘到連錢包都弄丟了,我並沒有因此買房買地,謝謝關心。

現在會想去玩玩看的契機,主要是連我周遭跟技術領域八竿子打不著的人都開始聊這個,再加上我本身對分散式技術一直很有興趣,偶然發現Ethereum的EVM是turing complete,同樣基於區塊鏈技術實現的Golem和野心勃勃的The Internet Computer像約好了一樣同時吸引了我的目光,就決定是時候從使用者的角度去從Ethereum切入體驗看看。

幾個月下來後這所謂「真正自由的去中心化網路」,並沒有讓我感受到它的支持者所大肆宣揚的種種美好,因此我現在是沒什麼在玩了。它的好已經很多人在寫了,因此本篇專注在為什麼我覺得它其實沒這麼好。

用瀏覽器自動化優化你的網頁QA人生

我個人目前偏好的工具是M牌的Playwright。因為早期calypso的e2e tests是用Puppeteer,不知為何它的行為常常跟我預期的相差甚遠,只能說八字不合;至於Selenium就更不對盤了,我連要弄個最基本的開個網頁點個按鈕都弄半天。Playwright倒是幾分鐘內就弄出來了,API設計上對我來說較易理解,而且原生支援多種瀏覽器,就這麼用到現在了。

不只是操作自動化

說到瀏覽器自動化,大部分人第一件想到的事情其實是屬於「操作」的自動化,例如:開啟網頁A,按下按鈕X,如果出現Y對話框就按下Z按鈕等等。但我個人經驗上,對於平日開發工作的輔助上,真正最常用的其實是瀏覽器的狀態設定腳本化,例如:cookies、local storage、query strings、解析度、桌面裝置vs行動裝置等等,能夠把這些都寫成一個能重複使用的腳本,在修改完程式後輕鬆地用一行命令生出需要的瀏覽器實體,不用重複手動設定,又不用動到自己平常用的瀏覽器。過去總是靠匿名視窗去手動調、這個瀏覽器開發用那個瀏覽器日常用,簡直不堪回首。

楊梅的後山:散步,運動,兼垃圾場

楊梅與龍潭交界處有座小山名為「乳姑山」,除較為人知的大型地標如揚昇高爾夫球場與東森山莊外,沿著山邊環繞的校前路與秀才路綠意環繞,坡度友善,又有多條優質的步道如秀才步道、福人步道、保甲古道橫亙其間。秀才路側到了高點視野開放處在好天氣甚至可以看到101,也因此吸引大量景觀咖啡進駐。

我個人最喜歡的是地圖上桃71這一側,也就是校前路這一邊:

這一側除了坡度更平緩外,到北庄前都是非常寬的雙線道,騎車或慢跑都不需要擔心與車搶道。春天時,一路慢跑到揚昇,路上甚至有許多不同的野花可欣賞。也因此,平日假日不論早晚都可看到許多人攜家帶眷健走或騎腳踏車自在穿梭,享受鄰近市區的自然氣息。

但對環保志工們來說,這裡其實是令人頭痛的超大垃圾場。特別是鄰近戶政事務所那一段,經常有人停車休息,順手就把垃圾往樹林裡丟,甚至還有很明顯是特地載垃圾去丟的。例如我曾經撿到過一整黑色垃圾袋用過的尿布,一整包廢線材,還有沿著福人步道沿路丟棄的數十包廢泥作建材

我們每次出勤至少撿50瓶阿比,100個煙頭,這絕對不是在開玩笑。下面這堆是我一個人在100公尺不到的範圍內撿的,而且垃圾都像會無性繁殖一樣,每次出勤都有辦法撿這麼多。永寧里是楊梅最大的里,志工隊有超過100人,這樣還能每次都撿這麼多,想想也有點不可思議。

志工隊大多是退休的大哥大姐們,大概只有我一個人是因為遠端工作在家才有這閒情逸致。但就算是我這個還算常運動的人,溜進林間裡去撈大包垃圾出來都常受傷,去年年底一次出勤就曾經拉傷肩膀,治療復健了一整個月才好。因此志工隊能處理的範圍其實非常有限,清出的大量垃圾在有限的時間和人力內也無法好好分類。

只要停下來往樹林裡探個頭,山林到底幫我們藏掉多少不堪可是一目瞭然:

撿的速度永遠跟不上丟,但又只能持續去撿,簡直有種薛西弗斯神話的既視感啊。

關於報稅這檔事

服用前請注意:本篇以個人經驗寫成,因此可能有許多法律或稅務相關用語不太精確,還請見諒。

就在去年,a8c在台灣人數堂堂衝破2位數,而且還在穩定增長中,正式擊敗東亞一哥日本,可喜可樂、可喜可樂。因此我們前陣子舉辦了第一次的區域性meetup,在天母古道的1800級階梯毀滅膝蓋、探索隱藏版瀑布,大吃興蓬萊排骨酥與其它大量與健康扯不上邊的食物。

當天我被問到最多的就是如何報稅,我當初也是被這問題搞得暈頭轉向過,是時候寫一篇文章總結一下。

先寫結論

內文很長,有空的人再泡壺茶、沖杯咖啡展開內文看看吧,沒空看一下這段應該就夠了 🙂

Automattic在沒有分公司的地方是以用「契約工作者」(contractor)的方式簽訂發當地貨幣的合約,這種情況可以用個人身分透過全部列舉或是用執行業務所得的名目來報稅,手續簡便但會報到哭出來。後來透過Zapier的前輩Chang-Hung介紹,我才知道更好的方式是成立一間機構,透過「外銷勞務零稅率」來節稅,我是選擇透過Simpany的服務成立行號。行號的稅計算很簡單,營業稅0稅率,免營業所得稅,最後就是「總收入*行業稅率」算出營利所得,算入個人所得稅去報(*修訂1)。軟體服務是8%,軟體出版則是6%,後來透過Simpany協助申請到後者,這樣一來我基本上繳不到稅,除非公司突然加我十倍薪水。但有一個最大缺點就是每個月都要去銀行用印才能拿到錢,我是在玉山開公司戶,他們是說這跟洗錢防制法有關,只要是用這種形式進來的台幣就避不掉。至於其他銀行有沒有別的方法,我就沒去進一步研究了。

因此,我一年關於稅務的常規大概如下:

  1. 每個月月底開一張invoice給公司(無制式格式,自己找個template做就行),以及用線上工具開一張電子發票,勾選「零稅率」,項目寫「服務費」。
  2. 銀行通知有匯入款進來要用印,帶著大小章風塵僕僕地騎車去蓋章。一開始會要請行員把水單email給我,但後來熟了都不用說了。
  3. 雙數月底,Simpany會通知要報稅,這時就把合約、給公司的invoice、銀行水單印出,包成一包預約順豐取件寄出。
  4. 時光匆匆來到5月報稅季,這時「71D 課稅年度營利事業投資人明細」根據Simpany提供的資料申報。(5/19補充)
  5. 時光又匆匆來到12月,這時候會需要申報「年度各類所得」,申報員工薪資等等。因為我都沒有,也沒打算給自己做個薪水的名目,所以就報0即可。(這部份見仁見智,有一說是為了將來申貸或信用卡申辦等事宜最好還是要設定個薪資,免得銀行那邊審核不過,我沒有相關經驗就是了。)
  6. 新的一年開始,繳給Simpany記帳服務費26000+珍奶型電子發票方案660 = 26,660。(*修訂2)

多了許多手續,但這樣一來稅負全免,一年只需繳給事務所26,660即可。

年度交換禮物來啦!

在a8c,每年年末會有一次秘密聖誕老人(Secret Santa)的交換禮物活動,也就是「小天使小主人」遊戲。雖然我幾乎每年都參加,突然想到我好像沒有寫過這件事。

活動進行方法是:

  1. 當年主辦人會在約11月中於watercooler p2宣布開始登記,有興趣的人就自行到內部一個名為"Automattic Gift Exchange"的WordPress網站登記。
  2. 登記時間截止。Automattic Gift Exchange會發送Slack ping,告訴你今年的送禮對象已經決定了,這時去該網站就會看到本次送禮對象的寄送資訊,以及一個可以匿名發送訊息給送禮對象或是你的秘密聖誕老人的表單。
  3. 收到禮物,是時候去watercooler p2發文炫耀啦!一個不成文的規定是最先收到禮物的人要開一個新的p2討論串。

因為公司的人遍布全球,所以玩這個好玩之處就在會有機會收到世界各地的東西。我曾經收過來自瑞典的節慶食品,其中一條焦糖醬因為真的太甜了現在還躺在我家冰箱;來自亞利桑那州的各式仙人掌特產以及當地小咖啡店的重烘焙豆,那支咖啡的風味之好我至今還念念不忘(我常常覺得台灣咖啡師大多對重烘豆過於歧視,不過那是題外話);還有一年某熱愛烘焙的同事因為沒辦法寄她自己的作品來,居然訂了Biolove的蛋糕給我,她不通中文也沒到過台灣,令我印象深刻。

今年收到的是來自英國的恐怖漫畫:Ghost Island: The Complete Collection:

這本書來自一位曾經在grand meetup合作過的同事。他事前有寫匿名信給我,想多了解我的喜好來選擇。
「你最近一次追劇是追了什麼?」
「魷魚遊戲」
大概是這樣,他選了一本恐怖漫畫給我。我收到沒多久就看完了,作畫呈現相當精彩,雖然整體故事張力和人物表現深度似乎礙於篇幅有些不足,但仍然是部佳作。

至於我送的禮物呢?過去每次我都是精選台灣美食大禮包寄送,但今年抽到印度同事,很不幸沒有任何運費合理的方式可以寄送,我只好上Amazon.in去買了一個我出外工作必備的收納神器GRID-IT,從當地商家送去,雖然氣勢不足,起碼顧到實用性與價值感。

如果2022年末全球物流能恢復正常,抽到我的人就賺到了。兩年悶氣集成的兩倍大禮包,必定要他一次從台灣頭吃到台灣尾,看到MIT字樣都會怕。

啥?Terminals database is inaccessible?

今天在設定開發環境以及安裝git-filter-repotmux-open時不知動到什麼,首先發現顏色都跑掉,接著tmux出現一系列令我抓狂的問題:tab completion陣亡,在zsh下delete變空白,打clear會出現terminals database is inaccessible 錯誤,然後我的命令列提示字元甚至還可以刪除:

再鬧啊

搞了半天,桌子快撞壞,才發現$TERM不知為何變成了tmux-256color,在tmux.conf中加下面這行設回macOS預設的xterm-256color就行了:

set -g default-terminal "xterm-256color"

我還是不知道我在安裝過程中到底動到什麼,或許是安裝git-filter-repo時有更新一些tmux相依套件,安裝tmux-open後重開tmux問題才顯現出來。後來我的顏色設置還是回不來,索性就當一個機會把用了6年還是7年的配色給換了。vim換了molokai

terminal則是自己隨便配一配:

僅以本文紀念一下今日花在這問題上的半天,和我一去不復返的配色們 T___T

WordPress.com的產品包裝與定價問題

圖文不符的特色圖片攝自日月潭星巴克的陽台。

前陣子在週末帶著家人到日月潭來了一次毫無事前規劃的三天兩夜旅行,這對我們家來說非常難得。因為我很怕人多的地方,也對長途的車程敬謝不敏,因此過去我們家出遊通常都選平日,出國的次數也比在國內多,乍看之下好像荷包很厚的樣子,其實只是把別人短程出遊10次20次的錢累積起來,加上坐飛機比開車容易避開人潮車潮而已。但疫情當頭,加上小子上小學後時間、空間彈性大減,即使我再怎麼自詡為家裡蹲的佼佼者,竟也覺得蹲到快發霉,必須硬著頭皮去人擠人。

三天兩夜的行程相當鬆散。每天孩子和太座都睡到9點才被我搖醒去吃早餐,吃完就回房間連線打Don’t Starve Together到快中午,接著才懶懶散散地出門。這種過度閑散風格也是我們不愛當天來回旅遊的原因,光是要一早出門就快做不到了,還能期望一天內能去到多遠呢?

不管去到哪裡,晨間散步是我最愛的時間。在天微亮之際,用慢到彷彿身體自己在走的步調,融入朝陽投出長長的影子中,以我一介外來俗人的身影,為這片當地人早已看慣的風景增添一抹新意。這次自然也不例外,在家人還好夢正酣之際,我的足跡已遍佈水社碼頭周邊,兩天來淋過雨也吸過晨霧,

在星巴克等咖啡時打開WordPress.com app,發現上次發佈文章竟已是4個月前的事了。回想起來,那差不多就是我被編入「產品包裝與定價」小組擔任開發領隊的時候。Harvard Business Review的文摘「For New Managers」有一段話說:

你本來以為成為管理者後會有更多自由和權限可以追求想做的事,但實際上你卻更加受限於整個組織複雜的人際網路中。

這幾個月來,關於這點我可說是用我的骨髓徹底體認到了。

久違的一人一車小放風

假期過到一半,向來頭碰到枕頭就開始咬牙打呼一覺到天亮的我,竟然也出現了睡眠品質問題。翻來覆去睡不著之餘,好不容易進入淺眠,卻又立刻醒來,就這樣斷斷續續不斷掙扎到外面天空微亮。回想起來,研究所時期也曾有過許多這樣因壓力而無法成眠的夜晚,那時我常常在天還沒亮就跳上我的125,往南寮或是寶山騎,不看地圖也不做任何計畫,只管讓未曾走過的巷道給我驚喜。有一次不小心騎到了氣象觀察站給工作人員一臉狐疑地盯著離開,還有一次騎到了山裡某個釣客聚集的小溪邊。比起有明確目的地,這樣隨意走走似乎更貼近旅行對我的意義。

這些日子來因為小孩在家上學,疫情升溫搭配滿天飛舞的流言攻擊弄得家人壓力山大,我又很剛好在帶時間緊迫的專案,身體和精神狀態在短短兩個多月間像雪崩一樣下滑,每天一張開眼睛就是在咬牙苦撐。上週發覺真的沒辦法再這樣撐下去,於是請了個12天的長假。就客觀角度來看,其實我已經很幸運了:疫情並未衝擊到我的收入,又已經是遠端工作老屁股了,我這樣竟然都覺得快撐不下去,連工作都受到衝擊的人究竟是過著怎樣高壓的日子呢?

「好啊,你是該放個假了,有什麼好玩的計畫嗎?」
「沒有喔,我哪裡都不去,只是會好好休息,當個全職家管而已。」

順帶一提,在和同事的對話中我們用的詞是"full-time nanny",覺得挺貼切的。12天的家裡蹲和本來的計畫當然是相差甚遠的,本來我計畫在今年6-8月請我的3個月sabbatical帶全家去歐洲壯遊,因為國外狀況仍然嚴峻就退一步安排了許多國內的活動,接著國內疫情爆發就再退一步變家裡蹲了。

DDIA閱讀紀錄(10) – 第三章總結:column-based storage

距離上次整10天了,閱讀進度愈來愈不穩定了啊啊啊啊啊。公司讀書會的進度其實已經到第6章,俺已經放棄追車尾燈,改成用自己的步調慢慢看了。

第三章的最後著重在解釋analytics資料庫在檔案的佈局上的一個有趣的實作策略:以資料欄為基礎(column-based)的序列化,而非一般transactional database的資料列為基礎(row-based)。所謂資料列為基礎的佈局,就是把每個資料列(row)一個接一個地寫到檔案中,而column-based就是反過來:把每個資料欄(column)一個接一個地寫到檔案中。會這樣做是因為硬碟的讀取頻寬有限,但統計分析經常要對百萬級以上的資料做運算,但同時又只需要少部分欄位即可。以資料欄為基礎去序列化,就可以有效做到只讀取需要的欄位了。

舉例來說,假設我們是個超級水果電商,我們可能會有長這樣的資料庫:

那麼,如果是資料列為基礎的檔案佈局概念上就長這樣:

那麼資料欄為基礎的佈局就大約是這樣:

從上圖也可以觀察到兩件事: 第一,資料列因為被以欄位打散到許多檔案中,因此一個資料欄檔中的順序是非常重要的,因為那是我們重建一個資料列的唯一依據。第二,因為一個欄位的值域通常不大,因此很容易壓縮,例如書中用的例子是run-length encoding。

但這樣一來column-based的資料庫寫入上會需要不同的策略。像B-tree那種會需要in-place寫入並維持排序的檔案結構自然是不行的,因為一個資料列現在可以橫跨數千個欄位檔,如果要從中間插入一個資料欄,那就意味著要去動那數千個欄位檔,保證機房人員整天換硬碟換到手軟,硬碟廠商笑開懷。前面的章節提過的log-structured storage便是一個解方:每次寫入只從檔尾附加(append),並適時進行壓實(compaction)。書上提到LSM-tree可以用,但我有點想像不出來這東西在記憶體中的SSTables(sorted-string tables)要怎麼建。如果是跟一般情形相同的平衡樹,因為本質上還是以資料列為單位,會不會造成什麼困難?還是會針對之後以欄為基礎的序列化做什麼特化?這些細節可能要去看實作才能知道了。

到此第三章終於堂堂結束,接著第四章為「Encoding and Evolution」,乍看之下應該是在說實際將資料序列化到檔案的實作策略 … 吧?這次第三章真的讀很慢,希望這次可以快一些。