為甚麼專業工作難以自動化
為甚麼 professional services AI 困難:專家工作依賴背景、證據、例外、關係、風險和問責,而不只是可重複任務。
重點摘要
- 專業工作難以自動化,因為困難之處往往是判斷甚麼重要,而不是執行已知步驟。
- AI 可以準備、搜尋、草擬、分類和監察,但可問責工作仍需要背景、證據、升級和審閱。
- 正確問題不是某個專業能否被自動化,而是哪類決定穩定、有來源、可逆,並安全到足以委派。
專業工作難以自動化,因為專業決定由背景、證據、例外、關係、時間、風險和問責塑造。
在這篇文章,專業工作指那些因有人依賴成果而重要的工作:客戶、病人、監管機構、法院、董事會、經理、同事或公眾。工作可以包含例行步驟,但專業價值不只在於完成步驟,而在於判斷情境代表甚麼、證據是否足夠、哪個例外改變正常路線、甚麼風險可接受,以及誰仍然要為結果負責。
所以,專業服務中的自動化通常最適合作為結構化協助,而不是一刀切取代。軟件可以減少摩擦、準備材料、偵測欠缺資料、草擬第一版和分派工作。更難的問題是:系統何時應被允許決定或行動?
這個問題位於 automation and delegation。
專業工作是情境化判斷
專業工作不只是一堆任務,而是在事實、規範、關係和後果互相作用的環境中進行的工作。
David Autor 關於自動化的研究在這裏有用,因為它區分 routine、可編碼工作,以及依賴 problem-solving、adaptability 和 creativity 的工作。在 2015 年 Journal of Economic Perspectives 文章中,Autor 指出電腦很擅長替代 routine tasks,同時放大人類在解難和適應上的比較優勢(AEA)。
這不代表專業工作不受 AI 影響。意思是,可自動化部分通常比職銜暗示的範圍更窄。合約審閱、臨床筆記、due diligence memo、planning application、grant assessment 或保險索償,都包含軟件可以支援的任務。但專業決定還依賴周邊事實、客戶風險承受度、證據強度、決定時間,以及必須為它背書的人或機構。
問題從何而來
背景改變同一事實的意思
同一個事實,在不同個案中可以有不同意義。一筆遲付款在一個帳戶中可能無傷大雅,在另一個帳戶中可能是違約,在受監管場景中則可能是早期警號。一份欠缺文件可以是行政缺口、blocker,或者證明底層流程已經出問題。
當重要規則不是「如果 X,就 Y」,而是「如果 X,加上這段歷史、這位持份者、這個期限、這項權限和這種風險,也許 Y」時,自動化就會吃力。
證據很少完整
專業決定經常在證據不完整下作出。工作不只是回答問題,而是知道現有證據是否足以回答。這為 AI 帶來不同設計問題:系統必須能顯示它用了甚麼、找不到甚麼、甚麼可能過時,以及哪裏應由人檢查。
NIST 的 AI Risk Management Framework 把 AI 風險視為依賴情境的 socio-technical 問題。它指出 AI 系統和部署情境都很複雜,風險來自技術系統、人類行為和社會情境之間的互動,而部署決定應在情境中考慮信可信度、風險、影響、成本和收益(NIST AI RMF4)。
這意味 AI 不應只被要求「給出答案」,也應被要求說明答案的證據狀態。它是否有足夠來源?來源是否最新?是否存在互相矛盾的紀錄?是否需要等待另一個批准或文件?這些問題在專業工作中經常比文字本身更重要。
例外承載真正風險
很多專業流程看似可自動化,因為正常路徑很清楚。問題是,風險往往集中在例外:不尋常條款、脆弱客戶、過期批准、衝突紀錄、edge-case deadline、未記錄 side agreement。
AI 可以協助識別例外,但機構仍需要政策處理下一步。系統應該阻止行動、要求更多證據、分派給審閱者,還是帶着備註繼續?這是營運設計問題,不只是模型能力問題。
例外亦經常是機構學習的地方。若同一類 edge case 不斷出現,可能代表流程規則需要更新、資料欄位需要補充,或審閱標準需要寫得更清楚。AI 可以幫助浮現這些模式,但是否改變政策,仍然是管理和專業判斷。
實務做法
實務做法是自動化穩定部分,並治理需要問責的部分。
任務層面的研究支持這個較窄觀點。Brynjolfsson、Mitchell 和 Rock 把「suitability for machine learning」rubric 套用到超過 18,000 個 O*NET tasks,發現大部分職業都有部分任務適合 machine learning,但少有職業可完全由 ML 自動化;要實現價值通常需要重新設計工作任務內容(AEA Papers and Proceedings3)。
這是理解專業工作的有用框架。不要問整個角色能否自動化,而要問哪些決定和行動有足夠結構。
| 工作類型 | 好的 AI 角色 | 人的角色 |
|---|---|---|
| 收集證據 | 搜尋、檢索、摘要、標示缺口 | 決定證據是否足夠 |
| 草擬 | 準備第一版和替代方案 | 擁有訊息和承諾 |
| 分類 | 建議分類和分派 | 審閱 edge cases 和有爭議標籤 |
| 監察 | 偵測改變、期限、異常 | 決定回應和升級 |
| 執行 | 完成低風險、可逆行動 | 批准高風險、不可逆或需問責行動 |
這不是甚麼
這不是反對自動化,而是反對假裝專業工作只是流程執行。
這也不是說每次人手審閱都有價值。設計差的審閱會變成 rubber-stamping。如果要求人批准一個沒有證據、時間、權限或實際反對方法的決定,human checkpoint 大多只是表演。
好的自動化會令人的角色更清楚。它縮窄審閱面、顯示證據、識別不確定性、記錄決策路徑,並在系統超出權限時升級。
換言之,自動化不應把專業判斷藏起來,而應把判斷需要出現的位置標示出來。當系統能清楚分辨 routine step、exception、recommendation 和 accountable decision,團隊才可以放心把部分工作交給軟件處理。
實務例子
法律和合規工作
AI 可以抽取條款、比較文件、識別欠缺簽署、摘要變更和草擬審閱筆記。更難的決定是:在這個客戶、這場談判、這個對手方和這種風險偏好下,條款是否可接受。
醫療行政
AI 可以摘要紀錄、準備表格、檢查 coding 和標示不一致。但臨床和營運決定仍然依賴背景、病人特定風險、專業責任和審閱路徑。NIST 的 generative AI profile 警告,自信但錯誤的輸出在重大決策場景中特別需要監察(NIST AI 600-15)。
客戶營運
AI 可以草擬更新、偵測 missed commitments、準備 agendas 和保持 account records 當前。但關係敏感的工作仍需要時間和判斷:何時升級、何時等待、何時打電話,以及何時一個技術上正確的答案會傷害信任。
甚麼時候完全自動化較可信
當決定低風險、規則穩定、證據完整、權限明確、成果可量度,而且錯誤可逆時,完全自動化較可信。例子包括產生提醒、格式化報告、去重紀錄、分派例行要求,或草擬不具約束力的內部摘要。
工作流越偏離這些條件,就越需要 source grounding、審閱和問責。
這也是為甚麼「自動化比例」不是最好的目標。更好的目標是把可安全自動化的部分自動化,把需要人判斷的部分準備得更好,並確保兩者之間有清楚交接。好的 AI assistance 不是把專業人士排除在流程外,而是把他們帶到最需要判斷的位置。
這個分界對採用 AI 很實用。團隊可以把流程拆成多個決定點,而不是把整份工作問成「可否自動化」。某些步驟可以完全自動,例如整理格式、抽取欄位、發內部提醒;某些步驟適合 AI 準備但人決定,例如比較證據、草擬建議、標示風險;某些步驟則應保留在人手,例如批准例外、對外承諾、處理高風險個案或作出影響權利和責任的判斷。
這亦令自動化不再是一個全有或全無的選擇。專業團隊可以逐步提高委派程度:先讓 AI 找資料和準備草稿,再讓它在受控 workflow 中標示缺口,然後在低風險可逆行動上執行。每一步都要有來源、權限、審閱和量度。這樣做比較慢,但更接近專業工作真正需要的信任。
最重要的是,自動化設計要承認專業工作中的「不知道」。資料可能不足、來源可能衝突、客戶取向可能未明、監管含義可能需要解釋。好的 AI 系統不應把這些不確定壓平,而應把它們帶到審閱者面前。當系統知道何時不能自動化,它反而更值得信任。
所以,專業工作的未來未必是完全自動化,而是更精準的委派。機器處理可重複、可檢查和可逆的部分;人處理需要責任、關係和判斷的部分。兩者之間的界線不是固定的,會隨資料質素、工具成熟度、監管要求和團隊信任而變。但無論界線如何移動,context、evidence、exceptions 和 accountability 都仍然是核心。
要把這個觀點用在真實流程,團隊可以先做 decision inventory。列出流程中每一個決定和行動,再標記它是否規則穩定、證據完整、結果可逆、風險低、權限清楚和可量度。符合條件的部分較適合自動化;不符合的部分則適合 AI 準備、人手判斷,或者暫時保持人手處理。
這種 inventory 也能揭示前置工作。有些流程不是不能自動化,而是現時紀錄太亂、ownership 不清、來源沒有版本控制、例外沒有政策。先修好這些營運問題,AI 才有可靠基礎。否則,自動化只會把原本模糊的工作更快地推向下一步。
因此,專業自動化的第一步經常是令工作更清楚,而不是令軟件更大膽。清楚之後,哪些可以委派、哪些必須審閱,才會自然浮現。即使某些步驟最後沒有被自動化,團隊也會因為來源、責任、例外和審閱路徑更明確而工作得更穩。
這種清楚度本身就是 AI adoption 的健康成果。
資料來源
- David Autor, "Polanyi's Paradox and the Shape of Employment Growth"
- David Autor, "Why Are There Still So Many Jobs? The History and Future of Workplace Automation"
- Erik Brynjolfsson, Tom Mitchell, and Daniel Rock, "What Can Machines Learn, and What Does It Mean for Occupations and the Economy?"
- NIST AI Risk Management Framework 1.0
- NIST Artificial Intelligence Risk Management Framework: Generative Artificial Intelligence Profile
- ISO/IEC 42001:2023 Artificial Intelligence Management System
/ 開始
先由一個營運範圍開始,再逐步擴展。
由一個清晰的審閱節奏、工作流程或團隊開始,找出更好的營運背景能即時改善準備和判斷質素的地方。