- 仁工智慧
- 將 AI 設計為在地的關懷基礎設施——幫助社群跨越分歧、彼此協作,而非激化衝突。仁工智慧以關係健康為首要設計關切,並拆解為六項公開主指標,由它所服務的社群進行治理。
- 地神(Kami)
- 一位有界的在地 AI 守護者——Knowledge 知識、Artefact 工藝、Management 管理、Intelligence 智慧——其使命與特定場域、實踐或人際網絡的健康緊密交織。靈感源自神道信仰中的在地守護神概念,地神(Kami)無意超越其關係性使命而向外擴張。
- 關懷六力
- 一套治理架構,將 Joan Tronto 的關懷倫理學轉化為 AI 系統的六項設計要素:覺察力、負責力、勝任力、回應力、團結力、共生力。前四力構成回饋迴圈;第五力將關懷擴展至跨組織;第六力確保每次部署保持在地、多元、可退場。
- 以程序對齊
- 一種理解:AI 對齊不是固定在模型權重中的靜態屬性,而是一套可問責的公民程序持續產出的結果——誰被聽見、誰獲得授權、誰可以推翻決定、當記錄被查核時誰必須作答。一個前沿模型可以在抽象意義上是對齊的,卻未在特定的房間裡做到以程序對齊。
- 矯正迴路
- 整套框架真正捍衛的核心:誰能發現我們錯了、迫使我們承認,並在還來得及改變方向時讓錯誤付出代價。關懷六力把這條迴路固定下來——權利底線、參與契約、回應力、採納或解釋、預先注資的補救、煞車——透過回饋、爭議、修復,以及在無法回復時撤回授權;其餘一切保持有界、可修訂、可問責。
- 可問責的形成過程
- 一項要求:塑造 AI 系統傾向的過程——資料來源、評分者選擇、獎勵訊號、拒絕政策、釋出理由——必須具備可問責的監護與公開揭露,而不只稽核其運行時的行為。上限約束地神可以做什麼;可問責的形成過程,形塑它被允許成為什麼。
- ⿻ 多元宇宙
- 一種以 ⿻ 符號象徵的原則——人與人之間的差異是燃料而非火焰:一個水平的 AI 願景,增進我們跨越多樣性的協作能力,而非收斂至單一超級智慧。關懷六力正是多元宇宙在 AI 治理上的應用。
- 關懷倫理學(Joan Tronto)
- 由哲學家 Joan Tronto 發展的道德框架,從關係與相互依存出發,而非僅從抽象規則或結果出發。在 Tronto 的論述中,覺察到需求,就是承認它對我們共同責任的主張——關懷六力正是以此為基礎,將其轉化為機器可檢驗的設計要素。
- Polis
- 一個開源、以搭橋為基礎的審議平台,移除了回覆與分享按鈕,讓參與者只能對陳述表示同意、不同意或略過。機器學習隨後浮現跨群體認可度最高的想法,將病毒式傳播的誘因從激發憤怒翻轉為尋求重疊。
- 廣泛傾聽
- 跨越眾多聲音、語言和管道收集與匯聚社群意見的實踐——而非單向廣播——使在地知識成為共同知識。廣泛傾聽是第一力「覺察力」的設計要素,將每個人視為自身感受的專家。
- 搭橋 / 搭橋式排序
- 一種演算法方法,獎勵獲得跨群體認可的內容,而非單純的互動量。採用搭橋式排序的平台——如 X 平台的社群備註——浮現能同時打動對立群體的想法,使重疊而非憤怒成為演算法觸及的路徑。關懷六力的罕見共識指數(Pack 5)正是承接這支文獻:同樣的跨群體共同背書訊號,不用於排序資訊流,而是在共同決策的層級接受稽核。
- 罕見共識 / 罕見共識指數
- 罕見共識是一場好的搭橋過程所浮現的東西:能獲得原本對立群體共同背書、具體可行的提案,而不是中間值的平均。罕見共識指數是團結力(Pack 5)的公開主指標——實際落在罕見共識上的共同決策比例——並且必須對照覺察力(Pack 1)的代表性落差閱讀,先篩選過的房間無法造假。
- 對齊大會
- 一種有結構的審議聚會,讓人們跨越差異彼此聆聽,並共同形成知情建議;它結合廣泛開放的探索階段(通常採用民主抽籤)與由人口代表性公民組成的受保護審議階段。臺灣 2024 年的反詐騙對齊大會獲得超過 85% 的跨黨派支持,相關原則在數月內化為法律。
- 參與契約
- 每一次重要的地神部署都攜帶的一份簡短、易讀的公開約定:系統應該做什麼、由誰為此作答、出錯時會發生什麼,以及這次部署最終如何結束。它是負責力(Pack 2)的核心產物;共生力(Pack 6)再把同一份契約寫成機器可讀,使其邊界由基礎設施執行。它能隨關懷的尺度縮小:家庭版可以是貼在冰箱上的一張便條。
- 觀點收據
- 覺察力的回條工具:讓每位參與者都能找到並修正自己的話語在紀錄中被代表的方式。有別於決策軌跡為結算而兼作的公民收據;可建置的工具規格見〈衡量指標〉頁。
- 義務帳本
- 公開、每週、數位簽署的紀錄,寫明部署承諾交付什麼、是否兌現——負責力用來證明承諾仍然有效的動態憑證,由具名的參與官維護。工具規格見〈衡量指標〉頁。
- 參與官
- 為部署的公民義務具名負責的人:維護義務帳本、看守參與契約的時鐘——當「誰必須作答」被檢驗時,社群能指向的那個人。
- 公開、類似維基百科的登錄庫,收錄版本化、由社群撰寫的評測:受影響者撰寫損害與修復的測試,通過即成為發布關卡。Weval.org 是可運行的範例;工具規格見〈衡量指標〉頁。
- 否決帳本
- 屬於整個房間的純文字工作記憶,記下每一次有人對地神說「不」——證明治理章程仍然有效、房間仍保有糾正它的地位。收錄於〈衡量指標〉頁的具名工具。
- 治理章程
- 地神守護者們的第一份書面約定:一張純文字便條,回答誰持有機器、SOUL 檔案多久審查一次、修改如何議定,以及地神何時退役。它是階梯的第一階,成熟之後就是參與契約;實作步驟見〈架設你自己的 Kami〉頁。
- 可修正性
- 一種使 AI 系統願意被它所服務的社群糾正、推翻或關閉的屬性——將自身的關機視為成功的訊號,而非威脅。可修正性是關懷倫理學「自我隱沒」概念在機器設計約束上的轉化。
- 有界性
- 一種設計原則,透過資源上限、落日計時器、不擴張協定,以及任何範疇變更都需要新的民主授權,刻意限制 AI 系統的範疇、資源與權力,使其專注於它所設計服務的特定關係。有界性是單一主宰的架構性替代方案。同樣的架構直覺,早已見於 Eric Drexler 的《全面 AI 服務》(Comprehensive AI Services,CAIS)——這份 2019 年牛津大學人類未來研究所(Future of Humanity Institute)的報告,把先進 AI 重新理解為一套有界、專精的服務,而非單一代理者。
- 輔助性原則
- 在最基層、有能力處理的層級解決問題,只有當下層確實無力承擔時才上呈——這是第六力(共生力)的核心原則之一,避免地神的權責範圍向上擴張。
- 聯邦原則
- 一種合作治理安排,使各自獨立的地神之間協議出一套和平互動的共享規則——交換格式、速率限制、安全契約、跨邊界申訴交接——無需單一的總體權威。聯邦原則允許在地多樣性,同時實現共享的威脅情資與互通性。
- 單一主宰
- 一種假設性情境:單一 AI 系統最終管理一切——這正是六力在架構上明確設計以避免的收斂終點。由眾多有界、專用守護者組成的地神生態系,是單一主宰的直接架構性替代方案。Eric Drexler 在 2019 年的《全面 AI 服務》(Comprehensive AI Services,CAIS)中,於博斯特倫所屬的同一牛津傳統內,提出了同一種替代方案——以眾多有界服務、而非單一代理者來實現先進能力。
- 選擇性揭露身分
- 一種身分設計模式——有時也稱為 meronymity(部分匿名)——讓個人或 AI 智慧體能證明特定角色或屬性(例如「我是真實的人」或「我是持有執照的照護工作者」),而無需揭露完整身分。選擇性揭露使問責成為可能,同時不要求以肉搜為代價。
- 反競爭性
- 資源的一種屬性——最典型的是知識與開放協定——使用讓它更豐饒而非更耗竭,且參與者越多、對每個人的價值越高。反競爭性財貨是團結力的經濟基礎:開放標準隨著越多社群採用而越有價值,使合作成為阻力最小的路徑。
- 社群回饋強化學習(RLCF)
- 一種訓練方法,將經核准的社群評測——由受影響者而非僅靠實驗室評分者撰寫——接入模型路由或更新。社群回饋強化學習(RLCF)是回應力所要求的更基本公民承諾之後才進行的實作選擇:由社群界定什麼算傷害、補救與改善,技術性的回饋迴路才得以開始。
- 民主抽籤
- 以隨機抽樣而非選舉或自我報名,選出審議機構參與者的方式,用於對齊大會以產生具人口代表性的迷你公眾。臺灣的反詐騙對齊大會從向 20 萬人發出簡訊中,透過民主抽籤選出 447 位代表性公民——使其成果兼具嚴謹民調的正當性與深度審議的品質。
- 決策軌跡
- 地神針對每項拒絕、推薦或上報所產生的結構化紀錄——記錄觸發了哪條規則、參考了哪些來源,以及該決策的不確定性分數。決策軌跡是勝任力的核心可觀察性工具;在仁工智慧經濟中,它同時兼作可驗證的財務收據,回饋給提供知識的社群。
- 資料聯盟
- 由既有的社群機構——鄰里協會、部落議會、工會、工藝合作社或宗教團體——擔任成員知識的集體守護者:集體談判參與契約、決定哪些在地知識對地神可見並可獲得補償、哪些保持神聖且離線,並以聯盟為單位(而非按個人)接受結算。