2022年8月30日 星期二

澳洲文化多樣性:人口普查

澳洲政府定期舉辦居民人口普查,最近一次舉辦是在2021年。
分析好的最新數據這次在6月28號公佈,今天剛好查資料翻到;
裡面有一些有趣的東西來記錄一下。

幾個關鍵數據:
  • 27.6%的人口出生在海外。
  • 在人口普查當日(COVID期間),有 61,860 名國際訪客身在澳洲。
  • 家庭使用英語以外的前五種語言,依序是:中文普通話(2.7%)、阿拉伯語(1.4%)、越南語(1.3%)、粵語(1.2%)和旁遮普語(0.9%)。
  • 血緣/祖先起源的前5位依序是:英格蘭人(33.0%)、澳大利亞人(29.9%)、愛爾蘭人(9.5%)、蘇格蘭人(8.6%)和華人(5.5%)。→【51%說英國應該是移民一二三代,30%說本地的可能第四五六七代了,錢幣印英女王多麼合理】
  • 排名前5的宗教信仰依序是:無(38.9%)、天主教(20%)、英國國教(9.8%)、伊斯蘭教(3.2%)和印度教(2.7%)。

不包含國際訪客,常住居民中,澳洲以外前五大出生地:
  1. 英格蘭 927,490人 →【原宗主國,很合理】
  2. 印度 673,352人 →【世界人口大國,很合理】
  3. 中國(不含港澳台) 549,618人 →【世界人口大國,很合理】
  4. 紐西蘭 530,492人 →【鄰居/兄弟國,很合理】
  5. 菲律賓 293,892 →【厲害了】

不包含國際訪客,常住居民在1996、2016及2021年的宗教信仰人數:
  • 基督教 12,582,764 → 12,201,600 → 11,148,814 【不增反減】
  • 其他宗教 652,218 → 1,920,835 → 2,538,587 【大幅提高】
  • 無宗教信仰 2,948,888 → 7,040,717 → 9,886,957 【大幅提高】
  • 普查總數 17,752,829 → 23,401,892 → 25,422,788 【25年成長43%】
我們看到宗教的消長變化,越來越多人不再虔誠信仰宗教。
1996年時澳洲不到一千八百萬人,同年土地小得多的台灣已二千多萬人。


其他數據表格:

表一、按年齡劃分的出生國家分布 →【七百多萬人在海外出生,台灣才4.9萬,港10萬、日4.5萬、韓10.2萬、星6.1萬、馬16.5萬、泰8.4萬、越25.8萬】


表二、按公民身分劃分的出生國家分布 →【當天在澳的台灣出生人口4.9萬只有2.7萬是公民,看來不少老台僑尤其長輩還是習慣住台灣。在澳港人多數已入籍,日人極少入籍,其他亞洲國家一半一半或差距不大】


表三、按州/領地及抵澳年份的出生國家分布 →【華人國家出生的70.7萬人中,24%即17.1萬人是在2016-2021這幾年抵達的新人。昆州比新州維州少了很多,可能是覺得雪梨墨爾本大城市的機會比較多吧】


表四、按州/領地劃分的血緣/祖先起源分布 →【澳洲835萬30%、英國愛爾蘭1214萬51%。139萬人選華人,2.6萬選台灣人,其中昆州佔比最高】


表五、按州/領地劃分在家中使用的語言分布 →【在家1830萬說英語、7萬德語、7萬法語、23萬希臘、23萬義大利、7萬葡語、17萬西語、37萬阿拉伯、44+萬印度(20萬Hindi+24萬Punjabi)、22+萬菲律賓(9萬Filipino+13萬Tagalog)、7萬泰語、32萬越南語、6萬日語、12萬韓語、30萬廣東話、69萬普通話/華語、2萬閩南語。數字與前表血緣資料大致相符,許多移民在家裡仍使用原母語】


表六、按抵澳年份劃分的英語口語熟練度分布 →【家中使用非英語的704萬人中,285萬人只說英語,尤以2016年以前居多,這些人與非英語人士組成家庭。近年移民逐漸由非英語人士組成。】


表七、按出生國家劃分的宗教信仰分布 →【澳洲出生的1702萬人中,807萬信基督教、759萬不信教。相較於篤信基督教的東南歐,以及篤信印度教伊斯蘭教的中亞及東南亞,東北亞(中日韓台)出生的人有三分之二不信教。】


表八、按州/領地劃分的宗教信仰分布 →【當日在澳的2542萬人中,有1115萬信基督、81萬信阿拉、62萬信佛、68萬印度教、21萬錫克教、10萬猶太教,另有977萬人無宗教。】


表九、按本國/海外出生及性別劃分的健康狀況分布 →【女性除了關節炎及哮喘,在心理精神方面包含躁鬱症的狀況比較多。男性則是糖尿病心臟病人數比較高。】


對人口資訊的分析解讀,可以有助於快速了解社會及文化。

2022年7月23日 星期六

原俠正楷 GuanKiapTsingKhai ,舒適方便的字型選擇

 今天自己整理了喜歡的字型,並第一次發佈github專案。

使用電子閱讀器蠻久了,陸續用過不少字型,有的還有簡轉繁以及偽直排功能,拿來看對岸網文非常方便。私以為簡體字最大的缺點就是多字共用,一簡對多繁造成無法精確轉換,非常不便。能夠動態以辭彙對應處理此問題的繁媛字型,我認為是非常傑出的作品,作者去年有發佈 OpenCCFontGenerator 工具用來製作簡轉繁字型,可惜我實際操做發現有些不懂的地方需要手動改程式,無法順利完成很可惜。

除了繁媛明、黑體,網路上各式黑體、明(宋)體跟圓體都曾用過一陣子,然試過幾款楷體卻都覺得有些負擔。2020年底時,macOS上頗受好評的內建字型 Klee One 開源了,優雅端正易讀的楷體受到許多人喜歡,雖是香港大佬作品,但因為是日文字型故中文漢字不足,難以用來閱讀頗覺可惜,所幸陸續有幾位大神無償去做補全開發。其中 lxgw 的霞鶩文楷改版快速字數最足,精神及毅力令人十分欽佩,他的霞鶩文楷繁中版使用傳承字形,也是我近來最常用的閱讀字型。另外大神 But Ko 的芫荽字形寫法最接近台灣教育部標準,同時兼具美感平衡,可惜只集中整理了近八千字(已超強非常感謝)。

於是一直有揉在一起弄個牛丸版的想法,剛好前陣子霞鶩文楷繁中版討論要做簡轉繁分支霞鶩風楷時,有神人提供了 TCFontCreator 這個工具,今天稍有空檔試了一下,發現方便易用功能成熟,雖可惜無法像繁媛那樣動態辭彙轉換,但同時有合併及繁化功能,且圖形化界免操作簡便。

我以芫荽為主體,加上霞鶩文楷輕便版補足不常用字及簡體字,合併出自己的「原俠正楷」,另外增加了一對多共用字「保持原簡字」,跟「以常用繁體字取代」的二個簡轉繁版本。這個字型名稱採來源字型之首字:芫、霞,取諧音原俠,當下布袋戲大俠閃現腦海,故英文以台語發音 GuanKiapTsingKhai 來拼寫。

上述所有東西都是在 github 上找到的,當然做好了也要來發佈在 github。自己摸索第一次建立了 Repository ,幸好介面還算直覺,完成後感覺離大神們距離稍微近了一小步。


有興趣可以下載字型用用看,或者下載工具自己轉換喜歡的字型,方便簡單!

2022年6月8日 星期三

使用MKVToolNix合併分割YouTube上的WebM影片

YouTube從前幾年開始,大量使用WebM這個由Google主導的視訊檔格式,優點是壓縮效率高檔案小速度快,但缺點是網站把較高品質的影、音分開成不同檔案,下載後不方便撥放。

當我們從CatchV等線上服務,或是自行剖析找到原始檔案連結後,下載到WebM、WebA、MKA、Mp4、M4a等檔案格式,最好是將分開的影、音檔案合併打包起來,以利後續保存及使用,其中以存成MKV格式最為方便理想。

MKVToolNix是一款免費、跨平台、支援繁體中文、將影片合併或分割為MKV影片格式的程式。這個軟體可以將各種格式的影片、外掛字幕、外掛音軌等合併成為一個MKV影片檔案。也可以將多部影片合併為一部影片,或將一部影片分割為多個檔案,由於合併的過程不需要重新編碼,因此可以快速的完成影片的合併,也不會影響原來影片的品質。

過程十分簡單,連接到官方網站下載安裝後開啟,把要合併的檔案拖曳進去,然後按下方中央的開始合併按鍵,就完成了!而且因為是打包而非編碼,速度非常快,個人經驗1Gb以下1秒。

如要分割影片、只保留片段,可以在「輸入」頁載入影片後,到「輸出」頁中間的分割部分,方式選擇「依時間戳記分割」,輸入要分割的時間如:「00:12:34.567-00:54:32.198」;同時多個片段則時間之間以逗號隔開如:「00:12:34-00:56:09,01:23:45-06:54:32」。

若需要反向處理,從MKV影片檔案擷取字幕、音軌與視訊的話,可以使用配套軟體gMKVExtractGUI,是由其他使用者開發的,需搭配主程式使用。

這個操作也很簡單,官網下載後解壓縮執行,把要拆解的MKV檔案拖曳進去後,軟體會分列視訊、音訊、字幕等內容,勾選後按右下角Extract按鍵,一下子就拆出來了。

有好的工具真是便利,任務輕鬆完成!