Context 不會躲在你的 database 裏
為甚麼專業 context 不只是已儲存的 data,而 AI 要支援嚴肅工作,不能只靠可搜尋 record。
重點摘要
- Database 可以儲存 records,但不會自動儲存那些 records 為甚麼重要。
- 專業 context 存在於 timing、relationships、assumptions、exceptions、authority 和 history,並不只存在於 documents。
- AI systems 需要 searchable sources,也需要方法顯示 gaps、conflicts、freshness 和 human judgment。
Context 不會躲在你的 database 裏。
Database 可能有 file、email、note、spreadsheet、contract、invoice、drawing 或 decision log。它甚至可能全部都有。
但這不代表它擁有 context。
一條 record 告訴你寫下了甚麼。它往往不會告訴你為甚麼那件事重要、誰把 advice 語氣放軟了、哪個 exception 大家心照、client 真正意思是甚麼、哪個 assumption 帶有政治性,或者團隊為甚麼沒有採用那個看似 obvious 的 precedent。
這就是把 AI context 當成 storage problem 的問題。
Search 有用。Retrieval 有用。更好的 indexing 有用。但 professional context 不是藏在 folder 裏等人抽取的物質。它是 record 周圍的意義。
完美 archive 仍然可以錯
想像一間公司有一個完美 archive。
每份 document 都可搜尋。每個 matter file 都已 index。每封 email 都可取得。每段 note 都已 transcribed。每個 client call 都有 summary。每張 drawing、invoice、brief、agreement、policy 和 spreadsheet 都可以 retrieve。
這聽起來很強。
它仍然可以給出錯答案。
不是因為 archive 是空的。而是因為它對 record 的意思太有信心。
舊 clause 可能存在,但 partner 可能知道不應該用在這個 client 上。Spreadsheet 可能顯示那個 number,但 finance lead 可能知道那個 assumption 只是在去年 budget 被接受。Design brief 可能寫着「bold」,但 studio 可能知道這個 client 用這個字,是指「不要那麼 generic」,不是「更大聲」。
這些不是 edge cases。這些就是工作。
Tacit knowledge 不是缺陷
Michael Polanyi 有一句著名說法,大意是「我們知道的,比我們能說出的更多」(Polanyi1)。這常常被當成 knowledge-management problem,好像只是組織沒有 document 得夠。
有時這是真的。有些東西本來應該寫下來。
但 tacit knowledge 不只是懶惰或 missing paperwork。它是 skilled work 的一部分。人會學到 patterns、histories、client preferences、professional standards 和 local meanings,這些都很難整齊地壓進系統的一個 field。
Nonaka 關於 organisational knowledge 的工作也有類似觀點:組織透過 tacit 和 explicit forms 之間的流動創造 knowledge,而不是假裝所有重要東西都已經 explicit(Nonaka)。
這對 AI 很重要,因為 retrieved document 是 explicit。圍繞它的 judgment 可能不是。
Records 是工作的痕跡
Document 不是工作。它是工作的痕跡。
Email 可能記錄了 decision,但沒有記錄 decision 周圍的 pressure。Contract 可能記錄了 final position,但沒有記錄 internal debate。Project note 可能捕捉了 action,但沒有捕捉它為甚麼重要。Drawing 可能顯示 current design,但沒有顯示塑造它的 rejected paths。
Brown 和 Duguid 關於 communities of practice 的工作在這裏很有幫助。他們指出 learning 和 knowledge 活在 practice 裏,不只活在對工作的 formal descriptions 裏(Brown and Duguid4)。人是透過參與 routines、language、shortcuts、exceptions 和 standards 去理解工作。
所以新人可以讀完整個 file,仍然未真正明白那宗 matter。
這亦解釋了為甚麼 AI system 可以 retrieve 到正確 document,仍然 miss the point。
Retrieval 可以做到甚麼
Retrieval-augmented generation 仍然重要。
基本想法是合理的:不要要求模型只靠 general training 回答,而是 retrieve relevant sources,再用那些 sources 產生答案。Lewis 和同事最初的 RAG 工作,令這個 pattern 成為 knowledge-intensive AI systems 的核心(Lewis et al.5)。
對專業工作來說,source grounding 不是可有可無。人需要知道答案從哪裏來。他們需要 inspect evidence、challenge it、update it,並決定它是否足夠。
Retrieval 可以幫助:
- 找出 relevant record;
- 減少對記憶的依賴;
- 展示 claim 背後的 source;
- 比較 version;
- 暴露 missing material;
- 準備 first pass 讓人 review。
這是真正收益。
但 retrieval 不會自動解決 context。
Retrieval 會漏掉甚麼
Retrieval 至少可以在五方面 miss context。
第一,它可能因為語言相似但情況不同,而 retrieve 了錯 source。
第二,它可能 retrieve 了一個舊 source,卻不知道 practice 已經改變。
第三,它可能 retrieve official record,但漏掉 informal exception。
第四,它可能找到幾個互相矛盾的 records,然後把衝突磨平。
第五,它可能把 absence 當成 evidence。如果 archive 沒有原因,系統可能會像沒有原因存在那樣行動。
近期關於 enterprise RAG benchmarks 的工作也指向這一點。內部公司 knowledge 往往需要 cross-document reasoning、conflict handling,以及辨認 information missing,而不只是 retrieve 一段 relevant paragraph(EnterpriseRAG-Bench6)。
更難的問題不是「我們能否找到文件?」而是「我們能否判斷這份文件值得多少 confidence?」
更好的問題
不要問「我們有沒有 data?」而應該問:
- 這個 source 是否 current?
- 它是否 authoritative?
- 它是否 complete?
- 是否有 known exception?
- 誰理解 history?
- 這份東西寫成之後,有甚麼改變?
- 甚麼會令它 misleading?
- Reviewer 應該檢查甚麼?
這些問題沒有「connect all the data」那麼令人興奮。但它們更接近 professional judgment 的運作方式。
目標不是令 AI omniscient。目標是令 knowledge 的狀態可以 inspect。
Context 有 social shape
Professional context 往往活在人與人之間。
Partner 知道 client 為甚麼對 timing 敏感。Manager 知道哪個 number 大家都不信。Architect 知道哪個 design move 因為某些從未寫進 brief 的原因被 reject。Senior associate 知道哪個 clause 看似 standard,卻會改變 commercial position。
這不代表 context 應該困在 private memory 裏。Private memory 很脆弱。人會離開、忘記、忙起來,或者假設其他人都知道自己知道的東西。
但答案不是假裝 context 已經在 database 裏。
答案是建立系統,讓人可以把 meaning attach 到 records 上:
- 這個 source 已經過時;
- 這是 current precedent;
- 這個 client 偏好這條路線;
- 這個 assumption 需要檢查;
- 這段 note 解釋了我們為甚麼 reject obvious option;
- 沒有先找這個人,這個 answer 就不完整。
Database 正是這樣變得更有用。不是因為它聲稱包含所有 context,而是因為它讓 gaps 變得可見。
簡單測試
一個使用 internal knowledge 的 AI system,有一個簡單測試:
它能否說出自己不知道甚麼?
它能否展示哪些 sources 支持答案?
它能否分開 record 和 interpretation?
它能否提醒 source 可能 stale?
它能否展示 conflicting evidence,而不是把它藏起來?
它能否指出行動前需要找哪個人,或走哪個 review step?
如果不能,系統對 search 和 drafting 仍可能有用。但不應被誤認為 context。
File 可能告訴你發生了甚麼。
但通常要一間 firm,才知道它為甚麼重要。
資料來源
- Michael Polanyi, The Tacit Dimension
- Ikujiro Nonaka, "The Knowledge-Creating Company"
- Nonaka, Toyama, and Konno, "SECI, Ba and Leadership"
- Brown and Duguid, "Organizational Learning and Communities-of-Practice"
- Lewis et al., "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks"
- EnterpriseRAG-Bench
/ 開始
先由一個營運範圍開始,再逐步擴展。
由一個清晰的審閱節奏、工作流程或團隊開始,找出更好的營運背景能即時改善準備和判斷質素的地方。