七年前,有感於教育部空有傲視全球的國語辭典資料庫,卻對民間應用設下種種限制,我曾投書教育部,寫信給立委,還寫了這篇-更開放的國語辭典,教育部準備好了嗎?
五年後,為了讓我的國語辭典App取得合法授權,抱著「申請表、切結書、計劃書再G8複雜」也要咬牙寫一下的心情,卻發現幾個月前還在網站的申請程序及表格下載網頁忽然人去樓空。透過教育部信箱詢問,得到的回覆是:《重編國語辭典修訂本》及其他線上字辭典正積極研議公開授權及相關事宜,未正式公告前無法授權完整內容供各界使用。而據了解,教育部希望最終能做到公開授權,但由於國語辭典著作權牽涉複雜,故處理過程繁瑣,開放之日難以預期。
最後,國語辭典App改用Google葉平教授所發起零時政府g0v「還文於民」計劃,在黑客松所擷取的辭典資料庫(關於一群駭客集體砍站連夜刧回整部辭典的精彩故事,可參考OSDC 2013 唐鳳的演講 [第8分鐘開始]),並仿效萌典做法解決授權問題。
今天意外收到教育部承辦人來信(兩年前承辦的湯先生仍記得我的詢問,熱心告知好消息,就甘心A)。提到教育部已經以「創用CC-姓名標示- 禁止改作 臺灣3.0版授權條款」釋出《重編國語辭典修訂本》、《國語辭典簡編本》與《國語小字典》,允許使用者重製、散布、傳輸著作(包括商業性利用),但不得修改該著作(不得修改指的應是辭典內容,如字義解釋例句等,以免誤導大眾。資料格式調整修改應不在此限,不致影響開發),使用時必須遵照「使用說明」要求。
不需要檢附身分證、咬破手指寫切結書與瞎掰計劃書,任何人都可以直接由網站下載資料動手寫程式應用,也不禁止商業應用,這才是我心中開放資料(Open Data)的典範!
試著下載重編國語辭典資料檔,發現已結構化辭條項目,依注音排序分欄儲存在Excel檔,並已轉好Unicode碼。
Unicode不支援的異體字或罕見字改採圖檔顯示,GIF圖檔也已一併附上了。(但字型好醜 XD)
從今以後,要拿國語辭典發展有趣應用,再也不用擔心授權問題囉~
為教育部按一個大大的「讚」!