概念

為甚麼專業工作難以自動化

為甚麼 professional services AI 困難:專家工作依賴背景、證據、例外、關係、風險和問責,而不只是可重複任務。

重點摘要

  • 專業工作難以自動化,因為困難之處往往是判斷甚麼重要,而不是執行已知步驟。
  • AI 可以準備、搜尋、草擬、分類和監察,但可問責工作仍需要背景、證據、升級和審閱。
  • 正確問題不是某個專業能否被自動化,而是哪類決定穩定、有來源、可逆,並安全到足以委派。

專業工作難以自動化,因為專業決定由背景、證據、例外、關係、時間、風險和問責塑造。

在這篇文章,專業工作指那些因有人依賴成果而重要的工作:客戶、病人、監管機構、法院、董事會、經理、同事或公眾。工作可以包含例行步驟,但專業價值不只在於完成步驟,而在於判斷情境代表甚麼、證據是否足夠、哪個例外改變正常路線、甚麼風險可接受,以及誰仍然要為結果負責。

所以,專業服務中的自動化通常最適合作為結構化協助,而不是一刀切取代。軟件可以減少摩擦、準備材料、偵測欠缺資料、草擬第一版和分派工作。更難的問題是:系統何時應被允許決定或行動?

這個問題位於 automation and delegation

專業工作是情境化判斷

專業工作不只是一堆任務,而是在事實、規範、關係和後果互相作用的環境中進行的工作。

David Autor 關於自動化的研究在這裏有用,因為它區分 routine、可編碼工作,以及依賴 problem-solving、adaptability 和 creativity 的工作。在 2015 年 Journal of Economic Perspectives 文章中,Autor 指出電腦很擅長替代 routine tasks,同時放大人類在解難和適應上的比較優勢(AEA)。

這不代表專業工作不受 AI 影響。意思是,可自動化部分通常比職銜暗示的範圍更窄。合約審閱、臨床筆記、due diligence memo、planning application、grant assessment 或保險索償,都包含軟件可以支援的任務。但專業決定還依賴周邊事實、客戶風險承受度、證據強度、決定時間,以及必須為它背書的人或機構。

問題從何而來

背景改變同一事實的意思

同一個事實,在不同個案中可以有不同意義。一筆遲付款在一個帳戶中可能無傷大雅,在另一個帳戶中可能是違約,在受監管場景中則可能是早期警號。一份欠缺文件可以是行政缺口、blocker,或者證明底層流程已經出問題。

當重要規則不是「如果 X,就 Y」,而是「如果 X,加上這段歷史、這位持份者、這個期限、這項權限和這種風險,也許 Y」時,自動化就會吃力。

證據很少完整

專業決定經常在證據不完整下作出。工作不只是回答問題,而是知道現有證據是否足以回答。這為 AI 帶來不同設計問題:系統必須能顯示它用了甚麼、找不到甚麼、甚麼可能過時,以及哪裏應由人檢查。

NIST 的 AI Risk Management Framework 把 AI 風險視為依賴情境的 socio-technical 問題。它指出 AI 系統和部署情境都很複雜,風險來自技術系統、人類行為和社會情境之間的互動,而部署決定應在情境中考慮信可信度、風險、影響、成本和收益(NIST AI RMF4)。

這意味 AI 不應只被要求「給出答案」,也應被要求說明答案的證據狀態。它是否有足夠來源?來源是否最新?是否存在互相矛盾的紀錄?是否需要等待另一個批准或文件?這些問題在專業工作中經常比文字本身更重要。

例外承載真正風險

很多專業流程看似可自動化,因為正常路徑很清楚。問題是,風險往往集中在例外:不尋常條款、脆弱客戶、過期批准、衝突紀錄、edge-case deadline、未記錄 side agreement。

AI 可以協助識別例外,但機構仍需要政策處理下一步。系統應該阻止行動、要求更多證據、分派給審閱者,還是帶着備註繼續?這是營運設計問題,不只是模型能力問題。

例外亦經常是機構學習的地方。若同一類 edge case 不斷出現,可能代表流程規則需要更新、資料欄位需要補充,或審閱標準需要寫得更清楚。AI 可以幫助浮現這些模式,但是否改變政策,仍然是管理和專業判斷。

實務做法

實務做法是自動化穩定部分,並治理需要問責的部分。

任務層面的研究支持這個較窄觀點。Brynjolfsson、Mitchell 和 Rock 把「suitability for machine learning」rubric 套用到超過 18,000 個 O*NET tasks,發現大部分職業都有部分任務適合 machine learning,但少有職業可完全由 ML 自動化;要實現價值通常需要重新設計工作任務內容(AEA Papers and Proceedings3)。

這是理解專業工作的有用框架。不要問整個角色能否自動化,而要問哪些決定和行動有足夠結構。

工作類型好的 AI 角色人的角色
收集證據搜尋、檢索、摘要、標示缺口決定證據是否足夠
草擬準備第一版和替代方案擁有訊息和承諾
分類建議分類和分派審閱 edge cases 和有爭議標籤
監察偵測改變、期限、異常決定回應和升級
執行完成低風險、可逆行動批准高風險、不可逆或需問責行動

這不是甚麼

這不是反對自動化,而是反對假裝專業工作只是流程執行。

這也不是說每次人手審閱都有價值。設計差的審閱會變成 rubber-stamping。如果要求人批准一個沒有證據、時間、權限或實際反對方法的決定,human checkpoint 大多只是表演。

好的自動化會令人的角色更清楚。它縮窄審閱面、顯示證據、識別不確定性、記錄決策路徑,並在系統超出權限時升級。

換言之,自動化不應把專業判斷藏起來,而應把判斷需要出現的位置標示出來。當系統能清楚分辨 routine step、exception、recommendation 和 accountable decision,團隊才可以放心把部分工作交給軟件處理。

實務例子

法律和合規工作

AI 可以抽取條款、比較文件、識別欠缺簽署、摘要變更和草擬審閱筆記。更難的決定是:在這個客戶、這場談判、這個對手方和這種風險偏好下,條款是否可接受。

醫療行政

AI 可以摘要紀錄、準備表格、檢查 coding 和標示不一致。但臨床和營運決定仍然依賴背景、病人特定風險、專業責任和審閱路徑。NIST 的 generative AI profile 警告,自信但錯誤的輸出在重大決策場景中特別需要監察(NIST AI 600-15)。

客戶營運

AI 可以草擬更新、偵測 missed commitments、準備 agendas 和保持 account records 當前。但關係敏感的工作仍需要時間和判斷:何時升級、何時等待、何時打電話,以及何時一個技術上正確的答案會傷害信任。

甚麼時候完全自動化較可信

當決定低風險、規則穩定、證據完整、權限明確、成果可量度,而且錯誤可逆時,完全自動化較可信。例子包括產生提醒、格式化報告、去重紀錄、分派例行要求,或草擬不具約束力的內部摘要。

工作流越偏離這些條件,就越需要 source grounding、審閱和問責。

這也是為甚麼「自動化比例」不是最好的目標。更好的目標是把可安全自動化的部分自動化,把需要人判斷的部分準備得更好,並確保兩者之間有清楚交接。好的 AI assistance 不是把專業人士排除在流程外,而是把他們帶到最需要判斷的位置。

這個分界對採用 AI 很實用。團隊可以把流程拆成多個決定點,而不是把整份工作問成「可否自動化」。某些步驟可以完全自動,例如整理格式、抽取欄位、發內部提醒;某些步驟適合 AI 準備但人決定,例如比較證據、草擬建議、標示風險;某些步驟則應保留在人手,例如批准例外、對外承諾、處理高風險個案或作出影響權利和責任的判斷。

這亦令自動化不再是一個全有或全無的選擇。專業團隊可以逐步提高委派程度:先讓 AI 找資料和準備草稿,再讓它在受控 workflow 中標示缺口,然後在低風險可逆行動上執行。每一步都要有來源、權限、審閱和量度。這樣做比較慢,但更接近專業工作真正需要的信任。

最重要的是,自動化設計要承認專業工作中的「不知道」。資料可能不足、來源可能衝突、客戶取向可能未明、監管含義可能需要解釋。好的 AI 系統不應把這些不確定壓平,而應把它們帶到審閱者面前。當系統知道何時不能自動化,它反而更值得信任。

所以,專業工作的未來未必是完全自動化,而是更精準的委派。機器處理可重複、可檢查和可逆的部分;人處理需要責任、關係和判斷的部分。兩者之間的界線不是固定的,會隨資料質素、工具成熟度、監管要求和團隊信任而變。但無論界線如何移動,context、evidence、exceptions 和 accountability 都仍然是核心。

要把這個觀點用在真實流程,團隊可以先做 decision inventory。列出流程中每一個決定和行動,再標記它是否規則穩定、證據完整、結果可逆、風險低、權限清楚和可量度。符合條件的部分較適合自動化;不符合的部分則適合 AI 準備、人手判斷,或者暫時保持人手處理。

這種 inventory 也能揭示前置工作。有些流程不是不能自動化,而是現時紀錄太亂、ownership 不清、來源沒有版本控制、例外沒有政策。先修好這些營運問題,AI 才有可靠基礎。否則,自動化只會把原本模糊的工作更快地推向下一步。

因此,專業自動化的第一步經常是令工作更清楚,而不是令軟件更大膽。清楚之後,哪些可以委派、哪些必須審閱,才會自然浮現。即使某些步驟最後沒有被自動化,團隊也會因為來源、責任、例外和審閱路徑更明確而工作得更穩。

這種清楚度本身就是 AI adoption 的健康成果。

資料來源

  1. David Autor, "Polanyi's Paradox and the Shape of Employment Growth"
  2. David Autor, "Why Are There Still So Many Jobs? The History and Future of Workplace Automation"
  3. Erik Brynjolfsson, Tom Mitchell, and Daniel Rock, "What Can Machines Learn, and What Does It Mean for Occupations and the Economy?"
  4. NIST AI Risk Management Framework 1.0
  5. NIST Artificial Intelligence Risk Management Framework: Generative Artificial Intelligence Profile
  6. ISO/IEC 42001:2023 Artificial Intelligence Management System

/ 開始

先由一個營運範圍開始,再逐步擴展。

由一個清晰的審閱節奏、工作流程或團隊開始,找出更好的營運背景能即時改善準備和判斷質素的地方。

預約示範
© 2026 Interfacing Research Laboratory
版權所有。