2026年5月14日概念

為甚麼專業工作難以自動化

為甚麼 professional services AI 困難：專家工作依賴背景、證據、例外、關係、風險和問責，而不只是可重複任務。

重點摘要

撰寫於 2026年5月14日

專業工作難以自動化，因為困難之處往往是判斷甚麼重要，而不是執行已知步驟。
AI 可以準備、搜尋、草擬、分類和監察，但可問責工作仍需要背景、證據、升級和審閱。
正確問題不是某個專業能否被自動化，而是哪類決定穩定、有來源、可逆，並安全到足以委派。

專業工作難以自動化，因為專業決定由背景、證據、例外、關係、時間、風險和問責塑造。

在這篇文章，專業工作指那些因有人依賴成果而重要的工作：客戶、病人、監管機構、法院、董事會、經理、同事或公眾。工作可以包含例行步驟，但專業價值不只在於完成步驟，而在於判斷情境代表甚麼、證據是否足夠、哪個例外改變正常路線、甚麼風險可接受，以及誰仍然要為結果負責。

所以，專業服務中的自動化通常最適合作為結構化協助，而不是一刀切取代。軟件可以減少摩擦、準備材料、偵測欠缺資料、草擬第一版和分派工作。更難的問題是：系統何時應被允許決定或行動？

這個問題位於 automation and delegation。

專業工作是情境化判斷

專業工作不只是一堆任務，而是在事實、規範、關係和後果互相作用的環境中進行的工作。

David Autor 關於自動化的研究在這裏有用，因為它區分 routine、可編碼工作，以及依賴 problem-solving、adaptability 和 creativity 的工作。在 2015 年 Journal of Economic Perspectives 文章中，Autor 指出電腦很擅長替代 routine tasks，同時放大人類在解難和適應上的比較優勢（AEA）。

這不代表專業工作不受 AI 影響。意思是，可自動化部分通常比職銜暗示的範圍更窄。合約審閱、臨床筆記、due diligence memo、planning application、grant assessment 或保險索償，都包含軟件可以支援的任務。但專業決定還依賴周邊事實、客戶風險承受度、證據強度、決定時間，以及必須為它背書的人或機構。

問題從何而來

背景改變同一事實的意思

同一個事實，在不同個案中可以有不同意義。一筆遲付款在一個帳戶中可能無傷大雅，在另一個帳戶中可能是違約，在受監管場景中則可能是早期警號。一份欠缺文件可以是行政缺口、blocker，或者證明底層流程已經出問題。

當重要規則不是「如果 X，就 Y」，而是「如果 X，加上這段歷史、這位持份者、這個期限、這項權限和這種風險，也許 Y」時，自動化就會吃力。

證據很少完整

專業決定經常在證據不完整下作出。工作不只是回答問題，而是知道現有證據是否足以回答。這為 AI 帶來不同設計問題：系統必須能顯示它用了甚麼、找不到甚麼、甚麼可能過時，以及哪裏應由人檢查。

NIST 的 AI Risk Management Framework 把 AI 風險視為依賴情境的 socio-technical 問題。它指出 AI 系統和部署情境都很複雜，風險來自技術系統、人類行為和社會情境之間的互動，而部署決定應在情境中考慮信可信度、風險、影響、成本和收益（NIST AI RMF^{4NIST AI Risk Management Framework 1.0}）。

這意味 AI 不應只被要求「給出答案」，也應被要求說明答案的證據狀態。它是否有足夠來源？來源是否最新？是否存在互相矛盾的紀錄？是否需要等待另一個批准或文件？這些問題在專業工作中經常比文字本身更重要。

例外承載真正風險

很多專業流程看似可自動化，因為正常路徑很清楚。問題是，風險往往集中在例外：不尋常條款、脆弱客戶、過期批准、衝突紀錄、edge-case deadline、未記錄 side agreement。

AI 可以協助識別例外，但機構仍需要政策處理下一步。系統應該阻止行動、要求更多證據、分派給審閱者，還是帶着備註繼續？這是營運設計問題，不只是模型能力問題。

例外亦經常是機構學習的地方。若同一類 edge case 不斷出現，可能代表流程規則需要更新、資料欄位需要補充，或審閱標準需要寫得更清楚。AI 可以幫助浮現這些模式，但是否改變政策，仍然是管理和專業判斷。

實務做法

實務做法是自動化穩定部分，並治理需要問責的部分。

任務層面的研究支持這個較窄觀點。Brynjolfsson、Mitchell 和 Rock 把「suitability for machine learning」rubric 套用到超過 18,000 個 O*NET tasks，發現大部分職業都有部分任務適合 machine learning，但少有職業可完全由 ML 自動化；要實現價值通常需要重新設計工作任務內容（AEA Papers and Proceedings^{3Erik Brynjolfsson, Tom Mitchell, and Daniel Rock, "What Can Machines Learn, and What Does It Mean for Occupations and the Economy?"}）。

這是理解專業工作的有用框架。不要問整個角色能否自動化，而要問哪些決定和行動有足夠結構。

工作類型	好的 AI 角色	人的角色
收集證據	搜尋、檢索、摘要、標示缺口	決定證據是否足夠
草擬	準備第一版和替代方案	擁有訊息和承諾
分類	建議分類和分派	審閱 edge cases 和有爭議標籤
監察	偵測改變、期限、異常	決定回應和升級
執行	完成低風險、可逆行動	批准高風險、不可逆或需問責行動

這不是甚麼

這不是反對自動化，而是反對假裝專業工作只是流程執行。

這也不是說每次人手審閱都有價值。設計差的審閱會變成 rubber-stamping。如果要求人批准一個沒有證據、時間、權限或實際反對方法的決定，human checkpoint 大多只是表演。

好的自動化會令人的角色更清楚。它縮窄審閱面、顯示證據、識別不確定性、記錄決策路徑，並在系統超出權限時升級。

換言之，自動化不應把專業判斷藏起來，而應把判斷需要出現的位置標示出來。當系統能清楚分辨 routine step、exception、recommendation 和 accountable decision，團隊才可以放心把部分工作交給軟件處理。

實務例子

法律和合規工作

AI 可以抽取條款、比較文件、識別欠缺簽署、摘要變更和草擬審閱筆記。更難的決定是：在這個客戶、這場談判、這個對手方和這種風險偏好下，條款是否可接受。

醫療行政

AI 可以摘要紀錄、準備表格、檢查 coding 和標示不一致。但臨床和營運決定仍然依賴背景、病人特定風險、專業責任和審閱路徑。NIST 的 generative AI profile 警告，自信但錯誤的輸出在重大決策場景中特別需要監察（NIST AI 600-1^{5NIST Artificial Intelligence Risk Management Framework: Generative Artificial Intelligence Profile}）。

客戶營運

AI 可以草擬更新、偵測 missed commitments、準備 agendas 和保持 account records 當前。但關係敏感的工作仍需要時間和判斷：何時升級、何時等待、何時打電話，以及何時一個技術上正確的答案會傷害信任。

甚麼時候完全自動化較可信

當決定低風險、規則穩定、證據完整、權限明確、成果可量度，而且錯誤可逆時，完全自動化較可信。例子包括產生提醒、格式化報告、去重紀錄、分派例行要求，或草擬不具約束力的內部摘要。

工作流越偏離這些條件，就越需要 source grounding、審閱和問責。

這也是為甚麼「自動化比例」不是最好的目標。更好的目標是把可安全自動化的部分自動化，把需要人判斷的部分準備得更好，並確保兩者之間有清楚交接。好的 AI assistance 不是把專業人士排除在流程外，而是把他們帶到最需要判斷的位置。

這個分界對採用 AI 很實用。團隊可以把流程拆成多個決定點，而不是把整份工作問成「可否自動化」。某些步驟可以完全自動，例如整理格式、抽取欄位、發內部提醒；某些步驟適合 AI 準備但人決定，例如比較證據、草擬建議、標示風險；某些步驟則應保留在人手，例如批准例外、對外承諾、處理高風險個案或作出影響權利和責任的判斷。

這亦令自動化不再是一個全有或全無的選擇。專業團隊可以逐步提高委派程度：先讓 AI 找資料和準備草稿，再讓它在受控 workflow 中標示缺口，然後在低風險可逆行動上執行。每一步都要有來源、權限、審閱和量度。這樣做比較慢，但更接近專業工作真正需要的信任。

最重要的是，自動化設計要承認專業工作中的「不知道」。資料可能不足、來源可能衝突、客戶取向可能未明、監管含義可能需要解釋。好的 AI 系統不應把這些不確定壓平，而應把它們帶到審閱者面前。當系統知道何時不能自動化，它反而更值得信任。

所以，專業工作的未來未必是完全自動化，而是更精準的委派。機器處理可重複、可檢查和可逆的部分；人處理需要責任、關係和判斷的部分。兩者之間的界線不是固定的，會隨資料質素、工具成熟度、監管要求和團隊信任而變。但無論界線如何移動，context、evidence、exceptions 和 accountability 都仍然是核心。

要把這個觀點用在真實流程，團隊可以先做 decision inventory。列出流程中每一個決定和行動，再標記它是否規則穩定、證據完整、結果可逆、風險低、權限清楚和可量度。符合條件的部分較適合自動化；不符合的部分則適合 AI 準備、人手判斷，或者暫時保持人手處理。

這種 inventory 也能揭示前置工作。有些流程不是不能自動化，而是現時紀錄太亂、ownership 不清、來源沒有版本控制、例外沒有政策。先修好這些營運問題，AI 才有可靠基礎。否則，自動化只會把原本模糊的工作更快地推向下一步。

因此，專業自動化的第一步經常是令工作更清楚，而不是令軟件更大膽。清楚之後，哪些可以委派、哪些必須審閱，才會自然浮現。即使某些步驟最後沒有被自動化，團隊也會因為來源、責任、例外和審閱路徑更明確而工作得更穩。

這種清楚度本身就是 AI adoption 的健康成果。

資料來源

/ 開始

先由一個營運範圍開始，再逐步擴展。

由一個清晰的審閱節奏、工作流程或團隊開始，找出更好的營運背景能即時改善準備和判斷質素的地方。

預約示範