From Micro to Macro: Resilience Engineering(1/2)- Academic Perspective

前情提要：

http://eshmanager.blogspot.tw/2016/12/high-reliability-organization-and.html

韌性(Resilience)的觀念

「韌性」(Resilience)一詞，當用來描述系統或組織特性時，主要是敘述系統與組織遭遇意外事故時，不脆弱（不易碎）/能夠承擔錯誤（承受衝擊）(non-fragile)、快速回復與事後調適(adaptive)的能耐。慕尼黑再保公司，依據組織受到意外衝擊之後恢復程度與速度，將組織的韌性(Resilience)區成以下四種等級：脆弱/毫無韌性(Not-Resilient),稍具韌性(Not very Resilient), 高韌性(Highly Resilient)、調適性(Adaptive)(圖1)。

脆弱的(Not-Resilient)組織受到意外衝擊之後，不單沒有辦法恢復到原有的運作水準或產能，運作水準與產能也必然隨著時間過去而更加惡化；稍具韌性的（Not very Resilient）組織，則是需要很長的一段時間才能夠恢復；高韌性（Highly Resilient）組織則在很短的時間恢復到原有的水準；而具備學習與調適能力的組織（Adaptive）甚至能利用危機為成長的契機，在遭遇意外事故後，更新機器設備或改善作業流程甚至整體改造，讓組織的產出水準更上一層樓。

組織韌性與調適能力示意(source: Munich Re https://www.munichre.com/en/reinsurance/magazine/topics-online/2017/topics-geo/resilience-overcoming-natural-disasters/index.html)

Righi et al.(2015)認為韌性(Resilience)這是觀念/立意良好、但定義抽象與各說各話的熱門字詞(buzzword)，此一觀念被應用在生態、商業、防災、毒理等不同領域學門當中，說明如何因應各種意外災難、衝擊與威脅，乃至於被借用於評估和說明風險大小、分析事故災難原因與風險威脅的管理。Woods(2015)則認為韌性的核心觀念為反彈(rebound)-從受到衝擊恢復為原來運作水平、穩健紮實(robustness)、脆硬的反義詞（the opposite of brittleness）與可適應未來意外狀況的能耐(the ability to adapt to future surprises)。Costella et al(2009)從管理系統的角度，認為彈性、學習、覺察與高階承諾(flexibility, learning, awareness, and top management commitment)等是組織是建構柔韌的必要元素。

韌性工程(Resilience Engineering)的學術脈絡

就「韌性」的學術思維與理論脈絡的演變，Perrow(1984)提出常態事故Normal Accident Theory (NAT)認為，工廠、核電廠或太空梭的運作有如一個複雜的系統(complex system)，內部不同單元間有許多複雜的控制回饋機制環環相扣（The system is complex and tightly coupled），儘管針對可能人為失誤或設備裝置失效都有預先設想與建置各項防護措施與安全連鎖機制，但意外事故的發生仍然無法避免，且若意外事故或故障未在事先的想定中則系統的反應有造成巨災的潛能（The system has catastrophic potential）；面對人員管理、組織運作、製程設備交互影響的複雜系統 (social-technical system)，預防事故發生的觀念從線性型態（1+1=2）與局部單元可靠度的思維模式，逐漸轉變為從"人機介面"與"各系統單元複雜互動"的非線性型態。

就複雜系統的問題而言，以往人因工程的角度專注於人機介面與探討造成人為失誤的原因(e.g., 蓄意忽略規定、操作錯誤或認知能力不足等)。另一個有關系統和人的關係的論述(CCCP, 1994)則是認為「人為疏失只是在人的能力和需求之間的不對等以及不適當的組織文化的自然結果。為了要達到高水準的人資效能(Human Performance)，除了理解人為疏失的原因外，也要了解影響人員行為的組織管理系統，以降低員工犯錯率與創造組織高可靠度。繼NAT認為事故的發生不是一種意外、而是一種必然的Normal常態現象之後，在學術界和實務界接著浮現與發展出來的則是高可靠度組織（High Reliability Organization, HRO）與韌性工程（Resilience Engineering, RE）。韌性工程（RE）的觀念源自於複雜系統與高可度組織理論(High Reliability Organization, HRO)。HRO認為透過組織內人員對於當下情境中各種因子的高度覺知(Mindfulness)，以便快速反應等等作為可以有效因應各種想定外的事件(Unexpected events)。就理論的區別與概念的差異而言，HRO延續原本提升可靠度（設備元件）與減少變異（人員作業）的思維，具體作法包含：教育訓練提升人的認知與能力、建立各種SOP與checklist、查核與確認的機制；運作上強調不要挑戰組織與硬體設備運作的極限與效率，盡量保守在設計安全規範內運作。而RE在概念上強調不是減小變異，而是加大組織與系統的容錯與承擔變異的能耐，以因應內外部環境的不斷變動進行調適（adaptation）。與原本的HRO相較，RE吸納更多先前包含人因、組織安全文化、系統工程等理論的觀念。

韌性的基礎與核心

依據Hollnagel (2007), Steen and Aven(2011), Righi et al(2015)等的見解，組織韌性包含下列核心能力與構面：預知危害與風險的能力、找出自身脆弱的環節與可能受到威脅與情境的能力、持續關注內外部環境變化、具備順應變化的能力、容錯與承擔錯誤的能力、在變動的情境當中學習與改善的能力、支持韌性的組織作為等，而讓組織逐步地建立與提升上述核心能力的關鍵如下：

1.管理高層的承諾與支持(Top management commitment)

RE的關鍵在於管理階層能建立並持續改進因應災害與意外事故的機制；因此，若無高層的承諾與支持充分尊重顧問的專業角色與其建議。(加上支持吹哨者)

2當責的觀念(Risk Ownership and Accountability)

當責意味著概括承擔一切後果與成敗，包含一些因果模糊與不確定因素的干擾。理想上，組織各項管理、乃至於狀況覺察與通報到緊急應變，都應該明確分工、分層負責與權責相符。然而實際執行與現場狀況千變化萬，從作業程序、系統故障或作業疏失，乃至於事故通報與緊急應變，都存諸多權責模糊與不確定因素不應迴避亦無可迴避。因此就組織因應意外的韌性而言，必須盡量強調分工明確、權責相符，避免發生知情不報、推諉卸責的狀況。

3.增加組織的彈性( Increase flexibility)

柔韌工程的基本假設是：組織考量成本與人員在壓力之下，事故與疏失的發生不可避免，因此辨識與承擔變異(與意外)的發生和減小變異(提高可靠度)一樣重要；就是辨識與承擔變異而言，彈性的來源為-讓第一線的工作人員(working level supervisor, 現場領班/組長)以及中階管理幹部都各自擁有無需請示上級的決策權限。另外在產線設計與規劃之初，即應考量人因與人為疏失與誤判的可能，而非期待人員不會犯錯或嚴懲重罰人為疏失。

此外，透過跨部門的活動以及經常性的訓練與演練，建立中階主管之間的關係，彼此更了解各自業務和資源。在事件發生後的應變期間，執行現場應變作業的中階主管可以向上申請必要的跨部門人力與物力資源協助。組織成員之間自發性建立的人際網絡，也是韌性的重要元素。

4.學習與經驗傳承

組織必須建立從異常事件與正常運作中學習的機制。針對不同階層或特性的員工，採取不同的學習模式。過去的安全教育或訓練，大體上都是針對第一線作業人員進行制式的知能訓練。但是這些訓練僅對於以技能為主(Skill-based)的作業或應變模式有效；對於需要以規則判斷(Rule-based)為主或知識(Knowledge-based)為主的作業或應變，必須對員工給予更高階的教育和訓練。尤其是針對需要以知識面對沒有標準作業程序或判斷規則可供參考（例如想定外的意外事故）的較高階管理幹部，則必須透過案例研討來學習他人的意外事件發生經過與處理經驗，擴大自己的知識領域與對於狀況覺察的偵測範疇。

此外，除了教導同仁作業的正確步驟與標準程序外，也要讓同仁報告犯錯的經驗與原因(而這需要一個讓員工信任與分享的組織氛圍文化)；現場作業人員共同從以上經驗當中，更能夠提升對於作業的容錯程度(safety margin)的掌握

5.生產系統與現場環境的覺察能力(awareness)

就柔韌工程而言，除了必須具備HRO所強調的對於系統偏離與各種信號的偵測與覺察之外，也包括對於狀態與安全邊界距離的覺知。這意味著當事人必須要很清楚自己當下的狀態/在做什麼與目前系統還有多少容錯的空間不斷改變的環境意味著組織因應的能力也在改變，所謂的環境警覺意識是指當事人能夠清楚知道生產與安全之間的權衡(trade-offs)；對於傳統工安而言，所謂的變動是一種可能產生不良後果的威脅，因此對於任何變動與差異，均須進行嚴謹的審核與變更管理(Management of Change, MOC)。

要建立這樣的覺察能力，即使最基層的員工不具備相當的知識與技能，至少現場的管理幹部必須要能夠透過適當的教育訓練，除了熟悉自己的「正常作業模式」或「正常狀態」之外，要能夠清楚了解系統偏離正常狀態的徵兆與後果，以及容許的反應時間與延誤及後果的關係。

韌性的量測手法與方法論

除了以上的觀念與構面，韌性在實務應用上的另一個大哉問是「如何量測組織的韌性程度？」能夠有效衡量與評價，才能針對不足之處進行強化，乃至於分析組織韌性不足的原因搭配進行各項改善方案；以下透過三篇期刊文章說明韌性的分析與量測。

1 問卷調查

第一種作法與方式相對簡單，採用問卷量表來分析與挖掘組織成員韌性(Resilience)的主觀感知，整套方法沿用目前分析組織安全文化與氛圍的程序，例如Azadeh & Zarrin(2016)用心理問卷量表方式來評估韌性的以下構面，包含管理階層承諾(Top management commitment)、報告文化(Reporting culture)、組織學習(Learning)、防災準備(Preparedness)、運作彈性(Flexibility)、組織覺知(Awareness, AW)、動員自主性(Self-organization)、團隊合作(Teamwork)、贅餘(Redundancy)、容錯能耐(Fault-tolerance)。研究結果顯示對於組織建構韌性的能耐而言，影響組織成員認知心態與運作成敗的關鍵因素為以下三點

高階主管的支持

員工的參與及自主

重視員工的激勵體制

心理問卷量表的分析方式雖然相對單純，姑且不論信度（reliability）與效度（validity），相關構面、衡量指標與關切構念（construct）間的關連性，就實務應用上的問題如下

代表性的疑慮-成員”覺得”組織重視韌性，不等於或代表組織”實際”上的韌性程度佳
內生性的疑慮-同仁參與相關業務(因)，對於相關業務有參與感，對此一業務的滿意度高(果)，而該項業務的好壞可能是另一回事

問卷衡量與問出的是當下的感受與知覺，至於組織如何塑造與形成此一氛圍與知覺，則需更深入與進一步的探討。

2 現場訪談

第二種作法是訪談現場的作業人員，了解原本的作業程序與步驟為何，再看當遭遇各種異常與忙碌的情況時，原先的作業程序與步驟如何調整以因應前述的種種異常，例如Rankin et al. (2014)透過訪談32位渡輪碼頭作業人員，了解他們如何因應交通量異常繁重、旅客遲到、孕婦或旅客急需就醫、碼頭港口電力中斷等六個個案狀況，並分別探討不同情境下的因應策略、實務作法的調整、塑造韌性所需的資源與組織脈絡。而塑造組織韌性所需的資源與脈絡正是前述所提的報告文化(Reporting culture)、組織學習(Learning)、防災整備(Preparedness)、運作彈性(Flexibility)、組織知覺(Awareness, AW)、動員自主性(Self-organization)、團隊合作(Teamwork)、容錯能耐(Fault-tolerance)等等構面，然而從各個案例的實際作為與差異對照說明當中，更能讓人”看見”以上構面的涵義內涵與對於如何進行實際作為”有感”。

就學術研究方法而言，透過質性訪談的方式來了解與衡量組織的韌性程度，其所需要耗費的心力與嚴謹度不會少於量性的問卷設計與量表分析，而且訪談調查依賴訪談者對被訪談者的工作內容有高度深入瞭解及對生產作業流程的背景知識，斷章取義與憑主觀意識詮釋或批判被訪談者的說詞與作為會嚴重影響這個方式的適用性與結果。就實務運作與手法應用而言，可以在遭遇異常事件或事故之後，邀請當事人分享心得與經驗(Lessons Learned)，闡述第一時間的狀況、當下個人感受與認知、各不同單位在遭遇狀況發生時的作為以及事後(後見之明)可以做得更好的改進與準備事項等，透過分享與討論交流的過程，也能夠幫助未能身歷其境的工作夥伴在心理與認知上做好準備。

3電腦程式模擬

第三種方法是代理人基模型與模擬(Agent-Based Model and Simulation, ABMS)，這個方法最早是Thomas Schelling在1971年用黑棋與白棋來代表黑人與白人進而模擬與解釋種族隔離的現象。Stroeve & Everdij(2017)即利用與透過ABMS來代表航空運輸各利害關係人的偏好狀態與模擬彼此間的互動，進而評估整體系統運作上的韌性程度與日後改善方向建議。就工業安全領域在電腦模擬上的應用而言，較成熟的模擬應用有群眾疏散狀況、傳染病擴散、氣體洩漏與火場情境等，在人因/人機介面乃至於組織管理上的模擬與應用相對少見。

以上三篇論文，從方法與工具(Method and Tool)與研究操作的角度來分析研究韌性，就研究韌性的方法論(Methodology)與本身觀念的而言，Steen & Aven (2011)認為談性柔韌的分析應該採取系統的觀點(systemic view)，而方法論有Hollnagel (2004)提出的功能共振分析方法Functional Resonance Analysis Method (FRAM)與Levenson(2004)提出的系統理論事故模型與過程Systems-Theoretic Accident Model and Processes(STAMP).

系統理論事故模型與過程Systems-Theoretic Accident Model and Processes(STAMP)
不同於保護層理論(Layer of Protection, LOPA)由下而上、著重硬體設施、不看系統與組織運作的侷限性，Levenson提出由上而下與控制的觀點來分析事故與系統安全的分析方法STAMP。保護層理論可謂是骨牌與起司理論的進一步量化與延伸，觀念是辨識造成危害的起始條件與導致造成事故的一連串失誤(Chain of Failure)；然而涉及組織與整體系統的風險分析，要分析整體與當下的情境脈絡，沒有所謂的可忽略風險，是否安全與風險是否可接受其實於當時情境有關(沒有絕對安全)，就組織運作而言，「人」才是關鍵。製程中一些自動化的軟硬體機制是用來輔助與避免人員犯錯，但人員犯錯只是病徵，而不是原因。因為，如果系統是完美的，那麼在系統中的操作人員就不可能犯錯。換言之，如果人員的操作可能導致系統的失敗，那麼系統的設計容許人員操作引發失敗就是系統的問題。但實際上，所有的系統設計即使不需要人為操作，也會發生故障或者情境超出系統可運作範圍，需要人為介入操作或排除；此外系統也需要定期的維修保養，必定需要人的介入。上述的狀況，飛機的機械系統、飛航控制系統、飛機駕駛、維修技工、航管人員的關係就是最好的例子。

所謂的控制，不單單指軟體程式或硬體的PLC自動儀控(interlock, fail-safe, redundant)，還包含生產與作業流程的管控(SOP, Operation and Maintenance Manuel)與社會性的管控(法規與政府管制、組織內的激勵措施與文化氛圍等因素)；安全的問題與事故的發生可以視為是各種控制措施與機制的失效(針對系統整體各階層的控制示意與汽車自動巡航控制系統請參見下圖)。

各階層控制示意圖(Source: Levenson, 2012)

汽車巡航控制(Adaptive Cruise Control, ACC)系統迴圈圖(Source: http://psas.scripts.mit.edu/home/2014-stamp-workshop-presentations/

從控制與STAMP的觀點看待事故的發生，不是去分析事故的一連串失誤(Chain of Failure)、追究人為的失誤或設備原件的失效，而是去分析造成人員犯錯機率提高的條件與情境、乃至於檢討設計規劃階段為何沒有要求採取可靠度更高的元件與機制，進而改進與提升整個系統的控制能耐(=降低事故與錯誤發生)。以飛航安全為例，不斷縮短落地時檢修保養的時間、減少檢修保養的人力、拉長定期特定系統檢修或零件定期更換的週期、簡化檢修保養後檢核確認的流程、機組員排班密度提高、機組員休息時間零碎切割、機組員人員因工作條件不佳導致流動率過高等，看似都是提高經營效率與獲利所必須採取的正當手段，但對於飛航安全而言卻是直接且負面的影響；也就是安全邊際區間(Safety margin)因為作業條件的改變而不斷地縮小。
對比LOPA與STAMP的分析架構與邏輯，LOPA可謂專注於分析STAMP當中第一部分製程軟硬體自動控制(Physical Design and Inherent Safety)與第二部分流程控制(Process Control and Management)當中的一部分；而對於STAMP所提第三部份社會性管控(Social Control and Interaction)則較少著墨。就實務的觀點與需求而言，第三部份社會性管控機制的失控與失衡，往往是塑造與造成第一部分軟硬體控制與第二部份製程與管理控制失效的原因；例如，設備機台配備的安全裝置往往是選配(optional)，而之所以採用安全裝置如閥的設備或者不設置相關的偵測器自動連鎖遮斷，往往是因為成本的考量；而之所以將成本的優先性與重要性視為比安全重要是因為組織制定每年成本減少降低10%的績效指標目標，再者就製造業而言，生產營運單位肩負較大的營收成敗責任，在組織內的發言份量高於勞安幕僚單位，長久下來，安全與營運單位間的互動失衡，形成對抗與失衡的惡性循環。只要長期不發生意外，安全就會愈來愈不被重視，安全管理措施只會被要求一步一步地放鬆，但風險卻也就因之提高。

功能共振分析方法Functional Resonance Analysis Method (FRAM)

與STAMP同樣駁斥將系統運作拆解為各單元、計算估計各單元的失效機率/平均失效時間、最後透過單元與事件間的線性組合規則(And/Or)來估算事故發生機率的事故分析傳統理念，FRAM認為沒有辦法用分析硬體單元失效模式與MTBF的方式來組織的失能與人和人互動產生的問題)，真實世界與複雜系統的運作輸出具備彈性(不是非0則1，而是有變異與調整的餘裕e.g., 60%~140%)，績效與風險是一體的兩面，不能切割成單元來分析，問題不是出在單一元件的可靠性不佳或人員的作業疏失，風險與事故必需視為一個整體系統的問題，分析的標的是不同部門、工作流程或者組織權責界面間的互動模式(調適共振，下圖)。

運作的各種變異與彈性是韌性也是釀成事故發生的來源(source: Kazuo Furuta, What is Resilience Engineering? http://cse.t.u-tokyo.ac.jp/furuta/teaching/resilience/resilience.pdf

分析各單元功能共振的架構(Describing a FRAM Function

(Source: Hollnagel E, http://functionalresonance.com/onewebmedia/FRAMily%202017_11_Erik%20Hollnagel_First Step.pdf)

FRAM分析四大原則如下

1.平衡看待與兼顧分析成功與失敗

成功源自於能夠預測外部環境變化與掌握利害關係人重點需求的能耐，失敗源自於失去該項能耐，成敗都可以歸咎於(面對變異的)調適能力。只有事情發展順利與成功的時候，人們才會大肆宣揚與歌功頌德，不順利與失敗的時候，隱瞞、相互指責與推卸責任是人之常情。所以發生事故之後，不能有如獵巫一般地找所謂根本原因，要兼顧與回頭分析日常運作的模式(=順利沒出錯的時候)，以”看出”組織與系統運作的脈絡。例如電子代工工廠，由於品牌客戶會要求成本降低幅度目標，因此公司內各部門以降低成本為績效指標，短期成本降低的成果成為某些單位主管的個人績效(升遷與獎金分紅)；然而成本降低(≒偷工減料)所導致的長期風險疑慮與事故損失卻由公司與股東承擔。

2.成功與失敗都來自於調適

成敗都是由於採取或不採取行動與因應外部壓力與種種相互衝突對立的目標，無數的抉擇與取捨塑造的組織日後的成敗與命運，然而種種做與不做決策與行為的背後是錯綜複雜的取捨(Trade Off)、利害相關者彼此間的調適與互動角力之後的結果。組織與系統因應環境變動的預測能力、應變彈性與餘裕是成敗共同的原因，分析韌性的目的即在於強化預測與掌握變化變異的能力。例如在時間與成本的壓力下，承包商交差草草了事，雖然組織內部有簽核管制機制，然而工程師以為底下承包商工頭會負責確認乃至上層主管也會再次確認，主管以為工程師己完成確認，結果由下到上沒有人確認。

3.事故的浮現是由於交互影響(牽一髮動全身的蝴蝶效應)

越複雜的系統與組織，越容易遭遇始料未及與意想不到的非線性結果；而這些非線性的重大意外事故(發生機率很低、嚴重度很高)，就日常管理與品管常態分配的觀點而言，可謂是一種異常離群值(outlier)或暫時性的副作用(回復常態之後不會再發)，可加以忽略；然而就風險管理與二項次分配而言，正是這些所謂的異常離群值、臨時意外與黑天鵝事件，才會讓組織失控失常與遭受到嚴重傷害。

4.共振或者因應外部環境變化造成變異放大

例如都市的交通堵塞，車輛1萬輛時，塞車十分鐘，2萬輛時塞車30分鍾，市區湧入3萬輛車時，塞車時間超過一小時(塞車時間並非隨著車輛數增加而等比例增加)；又比如遇到景氣好，一般公司企業首先採取加班方式的因應產能需求(不需要為了短期的需求而擴編組織)，而加班與工時變長會造成員工疲勞，導致注意力下降進而產生各種虛驚事件甚至工傷意外事故；而隨著景氣增長態勢明顯與確認，公司企業會採取擴廠與增加員工，然而這對於原本已經疲於奔命的員工而言，其實短期工作負擔是加劇而非減輕-一方面要訓練新進人員、適應新機台與設備，反應工安上面的副作用與就是-職災率的高低與景氣循環有顯著的正相關的現象(景氣好、職災率高；景氣不好，職災率低)。

韌性的限制

Madni & Jackson (2009)認為，就韌性的分析與探討而言，存在以下問題：

1. 如何平衡、調和與取捨以下對立的兩者：一方面是考量因應極端事件情境所需的安全彈性餘裕，另一方面則是提高生產產出與作業效率的壓力？

2. 如何衡量組織的彈性與柔韌程度？而衡量的結果能夠有效呼應與對應到那些組織所可能遭遇到的黑天鵝的意外與破壞性極端情境嗎？

3. 如何在組織內導入與推動韌性?對於各利害關係人而言，這件事情長期效應與當下獲利、充分性與必要性為何？如何知道已經達到臨界平衡點（critical leverage points）？（公司要先求眼前的生存還是要先重視安全？）

4. 韌性如何量化進而影響公司資源的分配?量測韌性後，如何將韌性的量化與可能造成的損失連結，進而分配公司有限的資源改善韌性？而韌性改善的績效是否值得公司投入與花費的資源或機會成本？

以上大哉問很深刻地點出導入韌性時的瓶頸與挑戰，各種組織與企業內部有著許多相互衝突的利益與目標必須妥協與取捨，例如：
- 內部控制(避免貪腐寄生)與因應外部變化(靈活)的取捨
- 產品設計製造必須面對標準化與客製化彈性的取捨
- (創造利潤的)效率與(分配利潤的)公平間平衡與取捨
- 績效指標的扭曲與偏誤=>大家都會迎合它，以創造出有利自己的結果
- 代理人問題：聰明的經理人，會善用資訊、權責、風險的不對稱來自利營私；然而代理人問題的對立面則是：公司沒有妥善管理、發揮潛能與極大化經營績效

就組織導入韌性而言，基本的衝突與兩難在於營運效率的最大化與運作餘裕彈性的取捨，營利事業單位要對股東負責，而股東對經營團隊的要求與期待則是股東權益最大化與公司各項獲利指標最佳化；也由於風險與事故發生與否往往只能透過機率來表達其發生潛勢，其能見度不如每天檢討日常運作指標乃至於每季於董事會上檢討的財務經營指標，對於決策的經營團隊而言，重視財務績效指標而忽視隱性的風險可謂是人之常情與相對合理的行為模式。在以上情境下，除非公司經營與獲利情況穩定，否則對於負責決策取捨的高層而言，其心態與心智模式可謂是試誤與被動因應，以事故的發生與否作為判斷訊號與指標：

- 沒有遭遇或發生重大事故，等同於說明公司工廠整個系統的運作還沒發揮極限、太保守，可以再更積極一些。

- 如果發生事故可以理解成公司工廠系統的運作遭遇到瓶頸，如果修正與克服了這些的障礙，可以恢復先前極具野心的方式追求更快的速度與更高的效率。

韌性有如雙面刃-可以是創造機會的優勢也可能是拖累營運效率無法最佳化的劣勢，因為就實務運作與管理而言，減小變異/加大可靠度亦或是增加容錯能耐與安全餘裕等作為都需要投入資源；對於資源有限的組織而言，投資提升容錯彈性與增加安全餘裕的各項備設與設施，從追求生產效率極致的角度而言，可謂是缺乏效率與閒置資產的浪費。就商業競爭而言，風險與報酬是一體的兩面，讓組織的風險最小的機會成本與代價可能是組織欠缺掌握機會的彈性；風險雖然隱含負面的涵義，然而能讓組織承受比競爭對手更大的風險(震動變異幅度)，就能從風險當中獲得創造競爭優勢的機會。

.

結論與建議
從評估風險轉變為導入推行韌性，最優先與迫切的事項不是學習各種工具手法亦非投入大筆資源與人力進行各項工程，而是改變觀念。高階主管重視組織潛在的風險與善待員工，員工會同樣的回報公司善意，這種相互友善對待將會誘發互正向循環。如果組織高層追求短期利益或只問績效成果不問過程，員工當然也會上行下效，造成組織文化與其成員，兩者互為因果、交互影響與演化的現象。

就韌性的導入與建置而言，韌性是在原先風險分析與可靠度工程的基礎上更上一層樓、不是推翻各種既有風險評估方法與管理措施的有效性；而是針對更難以預料的外部環境變化與更複雜組織內部互動機制，藉由情境模擬等方法應用，找出可以讓組織降低風險、強化應變能力與意外發生後能夠快速復原的地方。

讓組織具備因應錯誤與承擔各種無常的韌性是一個”健康”的觀念，問題的解決除了仰賴各種工程技術手法外，另一方面要依靠人員認知與能耐的提升：透過不斷學習、試誤與事故經驗來累積的智慧與承擔失敗的韌性。而培養承受失敗的韌性能耐需要有組織文化的脈絡，讓人們可以公開談論自己的失敗和錯誤，團隊如果有心理安全感，就可以學得更多，並且避免問題；而有心理安全感、不會因為坦白認錯而被懲罰，更能夠從勇於嘗試錯誤當中發覺機會，其中的關鍵是可靠度高的組織知道任何事情不可能沒有風險或取捨(短多長空亦或短空長多)，他們會提出清單，詳盡列出可能出錯的事情，事前檢查那份清單，之後每次遇到非預期的失敗，就擴充那份清單。風險無所不在，也組織營運過程的不可分割的一部分，正視風險與無常，考慮長遠的發展與做出明確的決策，就會塑造組織的命運與未來發展樣貌。

參考文獻

Azadeh, A., Zarrin, M., 2016. An intelligent framework for productivity assessment and analysis of human resource from resilience engineering, motivational factors, HSE and ergonomics perspectives. Safety Science 89, 55–71

CCCP, 1994, Guidelines for Preventing Human Error in Process Safety, New York, AIChe.

Costella, M. F., Saurin, T. A., Guimarães, L.B.M, 2009. A method for assessing health and safety management systems from the resilience engineering perspective Safety Science 47, 1056–1067

Hollnagel, E., 2004. Barriers and accident prevention. Aldershot, UK: Ashgate Publishing Limited.

Hollnagel, E., 2007.http://www.sites.google.com/site/erikhollnagel2/whatisresilienceengineering%3F> (accessed 7.01.2010).

Levesom, N., 2004. A New Accident Model for Engineering Safer Systems. Safety Science, 42(4), p 237-270.

Perrow, C., 1984. Normal accidents; Living with high risk technologies. Princeton Princeton University.

Rankin, A., Lundberg, J., Woltjer, R., Rollenhagen, C., Hollnagel, E., 2014. Resilience in Everyday Operations: A Framework for Analyzing Adaptations in High-Risk Work. Journal of Cognitive Engineering and Decision Making 8(1), March 2014, pp. 78–97

Righi, A.W., Saurin, T. A., Wachs, P., 2015. A systematic literature review of resilience engineering: Research areas and a research agenda proposal Reliability Engineering and System Safety141, 142–152

Steen, R., Aven, T., 2011. A risk perspective suitable for resilience engineering Safety Science 49, 292–297

Stroeve, S. H., Everdij, M. H. C., 2017. Agent-based modeling and mental simulation for resilience engineering in air transport. Safety Science 93, 29–49

Taleb, N. N., 2007. The Black Swan: the impact of the highly improbable London: Penguin. ISBN 978-0-14103459-1.

Woods, D. D., 2015. Four concepts for resilience and the implications for the future of resilience engineering Reliability Engineering and System Safety 141, 5–9

From Micro to Macro

2017年9月9日星期六

Resilience Engineering(1/2)- Academic Perspective

沒有留言:

網頁

一週內熱門文章

搜尋此網誌

瀏覽量

標籤

增廣見聞

常用網址

網誌存檔

追蹤者