2014年4月6日星期日

甚麼是「N年一遇」?「千年一遇」等說法是不是空談?


過去幾天本港經歷大雨冰雹天氣,之後天文台及渠務署就該場大雨的罕見程度各自表述。渠務署稱大家對重現期 (return period) 估計的差異源於量度尺度之不同,這引發坊間對「N年一遇」等說法的討論。

1.「N年一遇」的含義


「N年一遇」包含平均的概念。如果說某件事件 A 是十年一遇,即是說 A 平均每十年會發生一次。換句話說,假設每年間 A 發生與否皆為獨立事件,A 在某一年發生的機會是 10%。這並不是說 A 必然會於某十年間發生一次。事實上,A 不會於未來十年內發生的機會為 $(1-0.1)^{10} = 0.35$,即高達三成半。另一方面,A 有 1% 機會 ($=0.1^2$) 於連續兩年發生。

「N年一遇」是表達重現期,即某事件平均重現間距的一種方法,而在討論重現期的同時往往會牽涉到重現水平 (return level),這是由於事件的極端性通常取決於某項可測度變量的多寡。譬如說「某地平均每 5 年會出現一次日雨量超過 200 毫米」,這裡重現期為 5 年,而所對應的重現水平則是 200 毫米/日。不難理解,重現水平 (雨量) 越高,所對應的重現期會越長。

2. 怎樣能簡易地估計某重現水平所對應的重現期?


如果該重現水平不太極端,我們可以直接利用已有數據估算相對應的重現期。下圖顯示 1884-1939 及 1947-2011 年三月最高日雨量的直方圖 (histogram),共 121 數據點,可見大多年份三月沒有一天雨量超過 60 毫米,而最高日雨量則為 130 毫米 (於 2002 年 3 月 23 日錄得)。
1884-1939 及 1947-2011 年三月最高日雨量直方圖

根據日雨量的分布,我們可以繪製一張顯示累積概率的圖表 (如下)。橫軸為雨量,而縱軸為日雨量於該水平或以下的機率。假設 $X_1$、$X_2$、$\cdots$、$X_{121}$ 代表該 121 年的三月最高日雨量的隨機變量 (random variable),那縱軸顯示的為 $\mathbb{P}(X_i \le x)$ 此一機會 ($x$ 為橫軸所示雨量,而 $X_i$ 有任一年的意思)。
每年最高日雨量的累積概率圖

由此可見,三月最高日雨量超過 21 毫米的機會約為一半,而超過 45 毫米的機會則為 $(1-0.8)=20\%$。換句話說,平均每兩年便有一年三月最高日雨量會超過 21 毫米,而平均每五年便有一年三月最高日雨量會超過 45 毫米。我們可以說三月最高日雨量 21 毫米是「兩年一遇」,而 45 毫米則是「五年一遇」。其他雨量所對應的重現期可參考下圖。
不同雨量之重現期。留意橫軸使用對數刻度以便閱讀及比較

3. 如果 N 很大怎麼辦?


極值分布

先前的討論假設 N 不是太大,所以我們可以由其經驗分布 (empirical distribution) 中導出重現期。從 121 年數據的經驗分布中找出 2、5 或 10 年的重現期是頗為可靠的,但是如果 N 較大,如 100 甚至 1000,那我們不可能由經驗分布中找出重現期;即使從上圖勉強能說「百年一遇」的雨量為 127 毫米,此估計亦是極不可靠的。在此情況下,我們需使用統計學中的極值理論 (extreme value theory),藉助數學理論對極限附近行為的結果來推算。簡單來說,我們可以在不知道雨量理論分布之情況下,利用數學方法分析該些雨量最大值 (例如說,三月的最高日雨量) 的屬性。
 
以下的討論假設讀者對基本概率論有一些認識,如機率分布 (probability distribution),機率密度函數 (probability density function),隨機變量 (random variable)。如讀者不欲深究理論結果,可直接跳至下面「數據分析」一節中的圖表。

假設 $X_1,\ldots,X_n$ 為 $n$ 個獨立變量並根據同一機率分布 $F$,那麼不難發現,當 $n$ 趨向無限大時,它們的最大值 $M_n := \max(X_1, \ldots , X_n)$ 將趨向那些變量可取數值的上限。簡單地說,假如 $X_1,\ldots,X_n$ 本身沒有上限,由於 $M_n$ 只會隨 $n$ 增加,當 $n$ 趨向無限大時, $M_n$ 同時會趨向無限大。對 $M_n$ 的特性進行分析看似是沒有可能的事;可是極值理論告訴我們,對於大部分的分布 $F$ [註一],我們可以找出標準化常數 $a_n$ 及 $b_n$,使得 $\dfrac{M_n-b_n}{a_n}$ 跟隨某種非退化分布 (non-degenerate distribution) [註二],從而令分析 $M_n$ 變得可能。學者們證明出,該非退化分布必定為 Weibull、Gumbel 或 Fréchet 其中一款,而它們可以整合為廣義極值分布 (generalized extreme value distribution),其累積分佈函數 (cumulative distribution function) 是

$$G(x;\mu,\sigma,\xi) = \exp\left\{-\left[\max\left\{1+\xi\left(\frac{x-\mu}{\sigma}\right),0\right\}\right]^{-1/\xi}\right\}$$

其中 $\mu,\sigma,\xi$ 為該分布的參數,而 $\xi$ 最為重要,這是因為 $\xi$ 越大,該分布的「尾巴」越長,出現極端值的機會越高。

這理論性結果跟中心極限定理 (central limit theorem) 相似:大家都是將一個變量標準化,而該標準化後的變量趨向某個分布。

有了此結果,我們可以套用此概率模型於極值數據上,從而對極值的屬性進行分析,如計算重現期。

註一:這理論對於一般簡單的連續機率分布 (如正態分布及指數分佈) 均適用。
註二:退化分布為只有一個可能數值的分布,例如估計只有一個已知號碼球的攪珠機所攪出的號碼。

數據分析

要留意此分布適用於極值 (即 $M_n$) 而非原始數據上。你可能會問,一組數據只會有一個最大值,我們怎樣可抽取一個足夠大的樣本 (sample) 來作分析呢?實際上,我們通常會將數據分為多個區塊 (block),於每個區塊中抽取其最大值用作分析。區塊的大小往往是與一些實質時間分隔相關,如年、月等。選擇區塊大小也有學問:如果區塊太大,每組的最大值會更為準確但所得出樣本會較小 (因為區塊的大小與數目成反比),導致結果變化 (variability) 較大;如果區塊太小,那雖然樣本會較大,但每個區塊中的極值可能不太極端,令統計模型出現偏差,得出的結論可能無效。

留意於上述討論中我們使用的數據是每年三月份的最高日雨量,因此它們已經是極值數據了。將廣義極值分布套用於最高日雨量數據中,我們可找出於該分布中重現水平相對應的重現期,如下圖所示:
統計模型分析所得之重現水平-重現期的關係
圖中曲線為由統計模型估算出的重現水平-重現期關係,而圓點則為所觀測到的數據。各重現期所對應的重現水平詳列於下表:

重現期
(年)
經驗分布所得重現水平
(毫米)
極值分布所得重現水平連 95% 置信區間
(毫米)
10約 5560.1 (49.1, 79.4)
50約 122125.2 (88.7, 214.3)
100約 127166.3 (108.9, 323.0)
500無法估計310.3 (165.4, 825.1)
1000無法估計402.0 (194.8, ~1200)

3 月 30 日當天雨量為 103.1 毫米,按照此模型所估計的重現期為 32 年 (即平均每世紀會出現三次)。同樣做法可套用於時雨量或瞬時雨量,來計算出所對應的重現期。

4. 使用極值理論時要注意的事項


上述計算假設每年間的三月日最高雨量是獨立事件。由於每個數據點時間相差接近一年,此假設較為合理。但是,假如你想用此方法分析每個月的最高雨量,它們就很可能不是獨立事件,所得出的結論可能會有偏差。此外,極值理論屬於漸近理論 (asymptotic theory),數據量需趨向無限才成立。當然現實應用中不可能有無限量的數據,因此解讀結果時需要小心。最後,要得出「千年一遇」等估計無可避免地要使用外推法。由於該處沒有實測數據,一般來說估算所得重現水平的置信區間 (confidence interval) 會較闊。如上表,100 年一遇的雨量為 166 毫米,其 95% 置信區間為 109 至 323 毫米;外推至 1000 年一遇的估計重現水平為 402 毫米,但 95% 置信區間闊度竟然達 1000 毫米!因此,分析長周期的重現水平數據時,必須同時取得標準差或置信區間等資料,以估計該重現水平的可信度。就此例子而言,以 121 年的三月最高日雨量來估算千年一遇的重現水平並不太可靠。

後記


「N年一遇」的估算隱藏多個假設,所以不同機構因使用不同數據而得出大相逕庭的結論絕對有可能發生。對極值統計有興趣的朋友,可參考以下的入門書籍,此書顯淺而詳盡地介紹極值理論及其應用,適合初學者閱讀 (當然,假設讀者已有基本概率論的知識)。

Coles, S. (2001). An Introduction to Statistical Modeling of Extreme Values. Springer.

2014年3月31日星期一

昨夜的大雨


受低壓槽影響,本港昨晚天氣不穩定;大雨集中在晚上8時前後,多處於數小時內錄得過百毫米雨量,而香港中部自西至東均有冰雹報告,天文台首次於三月發出紅色及黑色暴雨警告。雖然香港間有落雹,但今次範圍之大實在罕見。以下為昨晚的雷達圖,留意紫色區域橫過香港的情況:

2013年11月8日星期五

世紀完美風暴


在踏入深秋的十一月,西北太平洋熱帶氣旋活動仍然活躍,31W 海燕更是為本年風季帶來高潮。聯合颱風警報中心已經確認海燕為有紀錄以來登陸時風力最強的氣旋 (連結),登陸時其中心一分鐘平均風力估計高達 170 節 (每小時 315 公里),比泰培所保持的紀錄 165 (每小時 306 公里) 還要高 [註一]。

上圖:聯合颱風警報中心的熱帶氣旋預測圖,可見海燕的估算強度為 170 節

與泰培不同的是,當時美國方面曾派出飛機深入風暴中心擷取數據,因此所錄得資料是無可異議的。但是,西北太平洋已經沒有實行飛機偵測一段時間,所以海燕的風力是估計得出的,因此存在一定不確定性。雖然如此,由於海燕是以巔峰強度登陸菲律賓,登陸位置附近的氣象站有可能錄得極其珍貴的風力及氣壓數據,利用此資料有機會導出海燕登陸前一刻的風速,或至少一個較準確的估計。

在缺乏實測數據的情況下,如何分辨熱帶氣旋 (尤其是成熟颱風) 的強度呢?很多氣象機構採用的是德沃夏克分析法 (Dvorak analysis,以下簡稱「德法」)。此分析法是由美國氣象學家維農·德沃夏克 (Vernon Dvorak) 總結衛星雲圖所得熱帶氣旋型態與它們實際強度的關係 [註二],並統一了使用衛星雲圖估計熱帶氣旋的強度的方法。德法將熱帶氣旋評為 T1.0 至 T8.0 的級別 (T值),以 8.0 為最高。由於將氣旋訂為 T8.0 級的條件極為嚴苛,絕少風暴能到此級別,較為著名的是 2006 年 4 月影響澳洲北部的氣旋莫妮卡 (Monica) (連結)。

本網的友站「香港熱帶氣旋追擊站」有一篇詳盡說明怎樣使用德法的文章 (連結)。大致而言,如熱帶氣旋未發展出風眼,強度一般根據氣旋雲帶的旋捲度而決定;發展出風眼後,則可由風眼大小、眼牆厚薄及眼牆高度等特徵判斷其強度。像海燕等較強颱風,氣象學家通常使用色調強化紅外線衛星雲圖 (Enhanced infrared satellite imagery) 來分析熱帶氣旋強度,這是因為此圖以不同顏色表示雲頂溫度 --- 雲頂高度越高,溫度越低。而雲頂越高一般表示風暴垂直結構越成熟,亦即強度越高。

海燕於 2013 年 11 月 8 日凌晨 2 時 30 分之紅外線衛星雲圖

海燕於 2013 年 11 月 8 日清晨 5 時 30 分之色調強化紅外線衛星雲圖
以上兩圖顯示海燕登陸前一刻的型態,明顯地利用下面的一幅我們可以很清楚分辨風眼周圍雲頂溫度 (色階於圖像下方)。採用德法來評估此時海燕的強度步驟如下:
  • 眼牆最低雲頂溫度低於 -80 度 (於舊色階中為 CDG,Cold dark grey),而該溫度的眼牆最窄處寬度明顯超過 0.5 緯距,因此 Eye Number 為 6.5 [註三]
  • 在 CDG 眼牆及 WMG 風眼 (Warm medium grey,即高於攝氏 10 度) 的配搭下,Eye Adjustment Number 為 1.0 [註四]
  • 外圍的額外旋捲度得出 Banding Feature 值為 0 至 0.5 [註五] 。KNES 分析 (連結) 認為外圍深層 (黃色) 環流與中間眼牆之間的雲帶未夠暖 (即 DG,dark grey,此雲圖上為淺藍色),因而將 Banding Feature 定為 0。
將上述三項相加就是最終的T值,海燕的T值為 6.5 + 1.0 + 0.0或0.5 = 7.5 或 8.0。由於德法沒有為 CDG 眼牆作出分析方法,因此 KNES 說法是 DT 值不予考慮。這就是說技術上海燕已經超出德法可以評估的範圍了。

海燕估算強度那麼強的另一個原因是 CDG 範圍持續時間十分長。颱風型態轉好與實際強度增加有一定的時間差,因此很多時候型態轉好後需維持一段時間,氣象機構才會上調其強度至該型態對應的範圍。海燕早於 11 月 7 日早上已出現環狀 CDG 區域 (即完全包圍風眼),至登陸前已超過 18 小時,因此強度需上調至對應 T8.0 的強度,即 170 節。一般的五級超級颱風出現環狀 CDG 區域已經十分難得 (大多數只更得 CMG [Cold medium grey,即此色調雲圖中的深紅色]),海燕竟然能擁有深厚 CDG 區長達一天,因此被認為是實現了「不可能的任務」。

雖然海燕在德法下是名副其實的「超強」颱風,但分析風暴型態有一定主觀性,各人估算出的強度或會有別。況且德法只是為熱帶氣旋強度作出一粗略的估計,要得到實際強度最好當然是參考實測數據。


p.s. 今晨客觀分析法曾得出 T8.1 的有趣現象:




註一:泰培以前的確曾出現比 170 節更高的估計風速,但氣象界普遍認為 40 至 60 年代的數據有高估成分。

註二:原始文獻為 Dvorak, V. F. (1984). Tropical cyclone intensity analysis using satellite data (47 pages). US Department of Commerce, National Oceanic and Atmospheric Administration, National Environmental Satellite, Data, and Information Service.

註三:其實德法中 CMG 層 (Cold medium grey,即此色調雲圖中的深紅色) 超過 0.5 緯距已可給予 Eye Number 6.5,所以海燕絕對是「超班」。

註四:風暴越強,其眼牆頂部溫度越低,而風眼中心則越暖。Eye adjustment number 就是針對此一特徵作調整。

註五:Banding feature 只會於 Eye number 及 Eye adjustment number 的總和比氣候值 (MET) 低時才會使用。由於風暴已連續增強多日,MET 已達 8.0。

2013年8月19日星期一

熱帶氣旋... "PEWA" ?!


上一篇的網誌距今已有一年了... 由於小弟出國留學後空閒時間較少,未能抽空撰寫網誌,細心的讀者或者已經感覺到除過去一個月外甚少熱帶氣旋發佈於下午 8 時發出 --- 或者你已經猜到我去了哪兒。 :P

好了進入正題,近日除大家於天氣報告中聽到的熱帶氣旋潭美外,有沒有留意在遠洋亦有一個名為「PEWA」的熱帶氣旋呢?這個 PEWA 是於中太平洋 (西經 140 至 180 度) 形成的,負責機構為美國中太平洋颶風中心 (Central Pacific Hurricane Center)。PEWA 隨後逐漸向西移動,於昨天進入西北太平洋範圍。因此,聯合颱風警報中心對其編號是 01C,有別於西北太平洋及南海上形成的熱帶氣旋之編號 xxW,至於日本氣象廳則如常給予新氣旋編號 1313 (1312 為潭美)。為保持一貫性,日本氣象廳不會對該氣旋另行改名。

上圖:近換日線的熱帶氣旋就是PEWA了
上圖:PEWA 經過國際換日線的一刻,在其右上方可見到熱帶氣旋 UNALA

由於中太平洋水溫較低,而高壓脊的配置亦不利氣旋發展,該地域較少熱帶氣旋生成,能通過換日線的就更少了。對上一個是 2010 年的熱帶氣旋 OMEKA,它於換日線附近徘徊,但由於強度相對較低,西北太平洋大多數官方機構並未將其升格,而香港天文台亦只將它定性為熱帶低氣壓 (連結)。如果要說比較觸目的就肯定是 2006 年的 IOKE (伊歐凱) 了,它於夏威夷以南形成並逐步發展,以五級超級颱風強度橫過換日線,相信當時已經有「追風」的氣象愛好者不會忘記吧!伊歐凱破了數個紀錄,較為觸目的為:它是首個於中太平洋形成並於同區域達到五級超級颱風強度的熱帶氣旋,亦為該區創下最低的氣壓紀錄,而且是全球維持在四級颱風或以上強度 (連續計算) 最久的氣旋。

上圖:2006 年伊歐凱橫過國際換日線的一刻

那使用中文的我們就不禁會問,究竟此氣旋的中文名稱是甚麼?西北太平洋熱帶氣旋名稱列表中的中文名字是經中、港、澳三地商議後得出的,而台灣則自行對名稱進行翻譯,但中太平洋氣旋名稱 (列表) 並沒有這既定程序的,因此很大程度上取決於誰先行翻譯,這亦同時取決於各氣象台的責任範圍。今次台灣將 PEWA 翻譯為皮瓦,中國大陸暫時未有官方譯名*,至於香港天文台的責任範圍比台灣及內地均小,PEWA 需起碼移至東經150度附近其環流才有機會於天氣圖上出現。但無論如何,每年發表的年度熱帶氣旋報告中仍會提及此氣旋。雖然沒有硬性規定天文台需採用哪個譯名,但為保持一貫性及避免有人誤將同一系統當作兩個獨立的熱帶氣旋,天文台很大機會會採用皮瓦這一名稱。

在留意 PEWA 動態的同時,在其東北面不遠處的雲團亦被升格為熱帶風暴,並被命名為UNALA。如此氣旋能維持一定強度並進入西北太平洋的話,相信台灣及內地又要傷腦筋怎樣給它一個中文名字了。

 
上圖:熱帶氣旋 UNALA 的預測路徑圖


*原文為「今次台灣及中國大陸均將 PEWA 翻譯為皮瓦」,經查證後發覺有誤,謹此致歉。
 

2012年7月27日星期五

意料之外的十號風球


韋森特襲港為我們帶來 13 年來的首個十號風球,但是在韋森特形成的初期幾乎沒有人會預計得到這個結果。還記得最初的數值預報路徑,不是一路向西北趨向台灣的就是西至海南;其後發展出部分模式如加拿大的 CMC 預測韋森特將於進入南海後停滯繼而北上,但當時相信不少人對此預測存疑 (CMC 以往的表現不太好)。之後歐洲中期預報模式亦加入,可是由於韋森特於南海初期西移速度頗高,大家也是採取半信半疑的態度。


上圖:7 月 18、19 及 20 日晚上 8 時部分數值預報模式預測 09W 的路徑

可是韋森特於 7 月 22 日上午突然移動緩慢,於南海停滯不前大半天後於 23 日改為北上並增強,當天中午經過於南海的一個油台不遠處,該處錄得的數據明顯顯示韋森特已增強為颱風,之後更進一步靠近香港,而隨後的事件大家應該還記得吧。不但路徑是意料之外,韋森特於離本港不足 400 公里的距離急速增強及發展出完整渾圓的風眼 (由強烈熱帶風暴增強至強颱風) 更是數十年來未見,因而天文台在其新聞發佈中亦表示「這樣迅速增強的情況,以上述熱帶氣旋 (按:即曾令天文台發出十號信號的熱帶氣旋) 來說是史無前例」。



上圖:韋森特於 7 月 23 日早上 11 時 01 分和下午 4 時 01 分之可見光衛星雲圖,以及 24 日凌晨 1 時 32 分之紅外線衛星雲圖。韋森特於近岸地方短時間內快速增強之現象是非常罕見的。


氣象就是有這麼多意料之外的變化,相信亦是令很多喜歡研究氣象人士愛上它的原因。這次的十號風球提醒我們絕對不可忽視大自然的力量:比較天文台已發佈的陣風數據,可見這個十號風球看似造成很大混亂,但仍是比較弱的一個。颶風集中在香港西南部,加上風暴深夜來襲,幸運地沒有人因此喪命。但正如前台長林超英所說,「香港不可能永遠幸運,下一次也許是超強颱風,下一次也許更靠近,對於颱風,大家必須嚴防啊」,如果韋森特的移動路徑東移 100 公里,危害已經會到達另一層次。

p.s. 一如以往,本站將會製作熱帶氣旋韋森特的回顧,讓大家重溫韋森特由誕生、轉向、侵襲、至消亡的過程。

2012年6月17日星期日

六‧一八


6 月 18 日於香港氣象史上算是「多事」的日子,較舊的大家可能記得 1972 年的六一八雨災,雖然每天雨量沒有破紀錄,但 6 月 16 至 18 日三天間的總雨量超過 600 毫米,山泥傾瀉終導致大廈倒塌慘劇。這篇要說的是較新的六一八事件,剛好於上一個龍年即 2000 年發生。當時一道低壓槽影響華南沿岸地區,其中一個渦漩於 6 月 18 日晚在香港以南不遠處增強為熱帶低氣壓,繼而向北移動,橫過西博寮海峽,約晚上 10 時 15 分登陸荃灣,其後進入內陸。為應對此低壓為香港帶來的強風,天文台直接懸掛三號風球,是自 1959 年首個未經一號風球或強烈季候風信號而直接掛三號風球的熱帶氣旋。

上圖:2000 年 6 月 18 日晚上約 10 時 30 分的衛星雲圖,當時該熱帶低氣壓正於新界中部

上圖:2000 年 6 月 18 日晚上 10 時的風向風速分布圖

從低壓槽中形成的熱帶低氣壓例子不少,但靠近華南沿岸而能成功發展的則較罕見。12 年後的今天 (雖然差一日),類似的情況於海南島對開海面發生。是次形成的熱帶低氣壓緯度較南,發展空間更大。

上圖:今天形成的熱帶低氣壓

由於預料該低壓向東北偏東移動,將會逐漸靠近本港,天文台於下午 4 時 20 分發出本年首個一號戒備信號。市民應留意該低壓的動向,並帶備雨具以防不時之需。

2012年6月3日星期日

罕見的凌日現象


本周三上午將出現罕見的金星凌日。雖然天空不會變暗,但如天色良好我們將看到一個黑點於太陽圓面上移動。


上圖:2004 年金星凌日照片

此現象對上一次於 2004 年 6 月 8 日發生,當年香港於下午可以見到。由於金星與地球環繞太陽公轉有一定規律,金星凌日的出現比較容易推算出,在每對相隔 8 年的凌日之間會梅花間竹地出現 121.5 或 105.5 年的「空檔」期,如下圖所示:


上圖:18 至 23 世紀的金星凌日事件

如錯過是次凌日,對大部分人來說將不可在有生之年再見到。

因為只有內行星才可能出現凌日現象,在地球只可看到金星及水星凌日。由於水星公轉週期短,其凌日現象較金星常見;但由於水星離地球更遠,它看來就更為細小了。水星凌日曾於 2003 及 2006 年出現,亦將會於 2016 及 2019 年重臨。比較可惜的是 2016 及 19 年的水星凌日皆會於香港晚間發生,本地的觀測者最快也要等到 2032 年才可看到此現象。

不難想像,其他星球上亦會出現凌日現象。比如說在火星,不但會出現水星及金星凌日,地球凌日也會定時發生。根據天文學家計算,20 世紀裡地球凌日曾於 1905 及 1984 年 5 月出現,當然兩次也沒有人看到。但是於 2084 年 11 月的下一次地球凌日,科技發展很可能容許人類在火星觀看此現象呢!

說回地球上的金星凌日,當天本站將提供直播站點,詳細資料載於 http://david.samsiu.hk/weather/special/20120606/index.html