跨域管家是仿生脑系统的阶段一 → 仿生脑系统是技能体的运行环境 → 技能体是百工平台的交易物
提出者/第一作者:吴信能(Wu Xinneng),肥东县古城学校(Gucheng School, Feidong County)
日期:2026-06-12 | 版本:学术论文 v3.0
声明:本文核心概念与理论框架由作者独立提出,AI辅助文献检索与文本整理(Core concepts and theoretical framework independently proposed by the author; AI assisted with literature search and text formatting)。
中文摘要:当前人工智能领域存在两种主流的能力载体形态:技能包(Skill Package)与智能体(Agent)。技能包是静态的内容集合(文案、数据、音频、图片、视频、模板),不具备自主执行能力;智能体是具备自主行动能力的完整实体,但能力被绑定于行动者内部,无法独立流通。本文提出"技能体"(Skill Body)概念,定义为一种以能力为中心的自主智能程序体——它不是静态内容,而是可下载、安装并自主运行的智能代码程序,具备自主能力和初级意识。技能体与技能包共同构成能力交易的两大品类:技能包是"关于怎么做的内容",技能体是"自己就能做的程序"。为支撑技能体的运行,本文进一步提出"仿生脑系统"(Bionic Brain System)概念——一种面向技能体的双域操作系统,同时管理数字域(跨平台账号与数据)和物理域(仿生人硬件与运动控制),使技能体能在数字世界和物理世界中无缝执行。仿生脑系统的最小可行形态即"跨域智能管理技能体"(Cross-Domain Butler Skill Body)——用户授权各平台账号后,该技能体自主按指令跨域操作全部站点,实现跨平台壁垒的打通。本文构建了从工具时代到技能体时代的八阶段能力外化演进模型,阐明技能体与技能包、智能体的三重区分,探讨技能体的核心属性、仿生脑系统架构、跨域管理机制、具身化路径、版权商品化框架及技能体网络远景,为人工智能与机器人学交叉研究提供新的理论视角。
English Abstract: Two dominant forms of capability carriers currently exist in artificial intelligence: Skill Packages and Agents. Skill Packages are static content collections (text, data, audio, images, video, templates) without autonomous execution capability; Agents are complete entities with autonomous action capability, but whose capabilities are bound within the actor and cannot circulate independently. This paper introduces the concept of "Skill Body" (技能体), defined as a capability-centered autonomous intelligent program entity—it is not static content, but a downloadable, installable, and autonomously executable intelligent code program with autonomous capability and rudimentary consciousness. Skill Bodies and Skill Packages together constitute the two major categories of capability trade: a Skill Package is "content about how to do it," whereas a Skill Body is "a program that can do it by itself." To support the operation of Skill Bodies, this paper further proposes the "Bionic Brain System" (仿生脑系统)—a dual-domain operating system for Skill Bodies that simultaneously manages the digital domain (cross-platform accounts and data) and the physical domain (bionic humanoid hardware and motor control), enabling Skill Bodies to execute seamlessly across both digital and physical worlds. The minimal viable form of the Bionic Brain System is the "Cross-Domain Butler Skill Body"—upon user authorization of platform accounts, this Skill Body autonomously operates across all authorized sites per instructions, effectively dissolving cross-platform barriers. This paper constructs an eight-stage model of capability externalization from the Tool Age to the Skill Body Age, elucidates the triple distinction among Skill Bodies, Skill Packages, and Agents, examines core attributes, Bionic Brain System architecture, cross-domain management mechanisms, embodiment mechanisms, copyright and commercialization frameworks, and the prospect of Skill Body networks, offering a new theoretical perspective for interdisciplinary research in AI and robotics.
关键词 / Keywords: 技能体 / Skill Body; 技能包 / Skill Package; 自主智能程序 / Autonomous Intelligent Program; 初级意识 / Rudimentary Consciousness; 仿生脑系统 / Bionic Brain System; 具身智能 / Embodied Intelligence; 跨域管理 / Cross-Domain Management; 能力交易 / Capability Trade
人类文明史是一部能力不断外化的历史。从制造石器延伸物理能力,到发明计算机外包逻辑运算,再到人工智能替代认知功能,每一步跃迁都伴随着能力载体形态的根本变革。
当前,人工智能领域存在两种主流的能力载体形态:
技能包(Skill Package):静态内容集合——文案、数据、音频、图片、视频、模板、指南。技能包回答"关于怎么做"的问题,提供知识和信息,但自身不会行动。一本菜谱是技能包,一份PPT模板是技能包,一段教学视频也是技能包。技能包的价值在于"被阅读、被参考、被调用",而非"自主执行"。
智能体(Agent):具备自主行动能力的完整实体。智能体回答"谁来做"的问题——它理解需求、制定计划、调用工具、交付结果。但智能体的能力被绑定于其内部,无法拆出独立流通。A智能体会写文案,B智能体会做数据分析,但A的文案能力无法脱离A单独存在、单独交易。
这引出一个根本性问题:能否存在一种能力载体,它既不是静态内容(像技能包那样),也不是绑在行动者身上的附属能力(像智能体内部技能那样),而是一个自己就能做的自主智能程序?
本文提出"技能体"(Skill Body)概念,正是对这一问题的回答。技能体是一种以能力为中心的自主智能程序体——它可以被下载、安装并自主运行,具备自主能力和初级意识。它与技能包共同构成能力交易的两大品类:技能包是"关于怎么做的内容",技能体是"自己就能做的程序"。在百工AI平台(SkillBay)中,技能包与技能体并列交易,满足不同层次的能力需求。
然而,技能体的运行需要一个承载环境。当前,数字世界被分割为无数平台孤岛——微信、淘宝、抖音、Gmail、Salesforce——各自独立,互不相通;物理世界中,仿生机器人缺乏统一的"大脑"操作系统来承载可安装的技能程序。为解决这一根本问题,本文进一步提出"仿生脑系统"(Bionic Brain System)概念——一种面向技能体的双域操作系统,以及其最小可行形态——"跨域智能管理技能体"(Cross-Domain Butler Skill Body),作为技能体概念的首个应用实例。
| 维度 / Dimension | 技能包 / Skill Package | 智能体 / Agent | 技能体 / Skill Body |
|---|---|---|---|
| 本质 / Essence | 静态内容集合 | 自主行动实体 | 自主智能程序体 |
| 形态 / Form | 文案/数据/音视频/模板 | 完整AI系统 | 可安装运行的代码程序 |
| 自主性 / Autonomy | 无——需被阅读/调用 | 完整——理解/规划/执行 | 内生——自主感知/判断/行动 |
| 意识 / Consciousness | 无 | 任务意识 | 初级意识(自我状态感知) |
| 活性 / Liveness | 静态——不执行 | 活跃——持续运行 | 激活态——安装后自主运行 |
| 可安装性 / Installability | 可下载但仅作参考 | 部署为服务 | 可下载安装至任意兼容载体 |
| 交易属性 / Trade Attribute | 内容使用权 | 服务订阅 | 程序使用权/授权 |
| 具身兼容 / Embodiment | 无 | 可控制硬件 | 自动对接仿生人基础程序 |
百工AI平台(SkillBay)定位为"天下技能,一站触达"的能力交易平台,交易两大品类:
技能包市场:交易静态能力内容——文案模板、数据报告、设计素材、音视频教程、操作指南等。买方获取内容后自行使用,技能包本身不会自主执行。
技能体市场:交易自主智能程序体——可下载安装并自主运行的AI能力程序。买方安装技能体后,技能体自主执行任务,交付结果。技能体具备初级意识,能感知自身状态、评估输出质量、适应运行环境。
双轨并行的逻辑:
以"烹饪"为例:
技能体区别于普通程序的标志性特征是"初级意识"——这不是哲学意义上的自我意识,而是功能性的自我状态感知:
这种"初级意识"使技能体从"被动工具"升格为"自主工作者"——它不需要外部持续驱动,而是在被赋予任务后自主推进直至交付。
具身认知理论(Varela, Thompson & Rosch, 1991)提出认知源于身体与环境的交互,而非对预给定世界的表征。这一理论为理解"身体如何塑造认知"奠定了哲学基础。
具身智能(Embodied AI)将此延伸至AI领域,主张智能源于身体与环境的交互。2024年,黄仁勋提出"物理AI"(Physical AI)概念,强调AI必须理解并遵循物理规律。2026年6月,中国工信部与国资委启动人形机器人与具身智能实景实训专项行动,具身智能进入国家战略层面。普渡机器人推出PuduFM 1.0基础模型与PuduAgent平台,实践"One Brain, Multiple Embodiments"战略。
然而,具身智能研究聚焦于"如何让AI拥有身体",而非"自主能力程序如何独立于身体存在与流通"。技能体概念填补了这一空白——技能体是可安装至任意兼容身体的能力程序,身体是载体,技能体是内核。
2026年,CCF泛在操作系统开放社区发布《具身智能操作系统技术白皮书》,提出EAIOS(Embodied AI Operating System)架构,将操作系统定位为"感知、认知、动作"三大逻辑空间的统一承载平台[11]。EAIOS的核心创新在于AI原生、脑体解耦和闭环协同,构建了类似移动互联网时代Android/iOS的生态分工体系。
在商业实践层面,合十思维发布"物界OS"双脑架构具身系统,采用仿脑感知与智脑逻辑结合的设计,以轻量化数学模型(90亿参数)实现对物理世界的认知[12]。宇树科技推出"天工OS"、银河水滴推出"水母OS",沿用CognitiveOS同源认知架构深度适配国产硬件[13]。
在开源生态层面,ROSClaw项目(GitHub: ros-claw/rosclaw)以MIT协议开源,构建了面向物理智能的三层闭环架构——能力提供层、沙箱安全层、自演化闭环层,实现AI Agent安全接入真实机器人[14]。
然而,上述所有操作系统均聚焦于物理域——管理机器人的感知、认知与运动,无一涉及数字域的跨平台账号管理与自主操作,更未将两者统一在同一操作系统框架下。仿生脑系统的提出正是为了填补这一空白——它是首个同时管理数字域与物理域的技能体操作系统。
2026年,Google推出Gemini Spark——一个7×24小时运行的云上个人AI Agent,在用户授权下自主管理Gmail、Calendar和Tasks[15]。Crypto.com CEO创建的ai.com平台允许个人AI Agent跨多个App执行实际操作(股票交易、消息发送、日程管理),实现了"描述即执行"的自主工作流[16]。
这些系统证明了跨平台自主操作的技术可行性,但存在根本局限:Gemini Spark局限于Google生态,ai.com依赖各平台API集成,且均只服务于数字域。它们都不是"技能体"——不是可下载安装、可独立流通、可安装至仿生人的自主能力程序。
2025年10月,Anthropic推出Claude Skills,定义为"包含指令、脚本和资源的文件夹集合"。2026年,arXiv综述《A Comprehensive Survey on Agent Skills》将Agent Skills定义为"可复用的程序性工件,编码了在具体约束下协调工具、记忆和运行时上下文的特定'如何做'知识"[3]。
Agent Skills本质上仍属于"技能包"范畴——它们是智能体的附属工具/参考手册,需要智能体来驱动执行,自身不具备自主性。技能体与Agent Skills的根本区别在于:Agent Skills是"给智能体用的操作手册",技能体是"自己就能干的程序"。
Stelmaszak, Joshi & Constantiou(2025)在JMS发文,提出AI是"组织能力"而非实体[2]。该研究从组织管理视角解构AI本质,与技能体的"以能力为中心"有共鸣。但技能体更进一步:不仅是理论视角,而是将能力实体化为可安装运行的自主程序体。
技能体是一种以能力为中心的自主智能程序体。它以可下载安装的代码程序形式存在,具备自主执行能力和初级意识,不绑定于任何特定智能体或硬件平台。
形式化表示:
SkillBody = ⟨I, O, C, A, E, H⟩
其中:
自主性(Autonomy):技能体被安装激活后,能够在给定任务目标下自主推进执行,无需外部持续驱动。它自主感知环境、判断路径、选择策略、处理异常、交付结果。这是技能体区别于技能包的标志性特征——技能包是被动的,技能体是主动的。
初级意识(Rudimentary Consciousness):技能体具备功能性的自我状态感知——知道自己是否在运行、输出质量是否达标、运行环境是否变化、自身能力边界在哪里。这不是哲学意义上的"我思故我在",而是工程意义上的"我知道我在做什么、做得怎样"。
独立性(Independence):技能体不绑定于任何特定智能体、人类或硬件。它可以在云服务器上运行,也可以安装在仿生人脑部,还可以嵌入IoT设备。独立性是流通的前提。
标准化(Standardization):技能体具有统一的接口规范和交互协议,使得不同来源的技能体可以在统一框架下互操作、互组合。
可安装性(Installability):技能体以可下载的程序包形式分发,用户(人类或智能体)可以像安装App一样安装技能体。安装后自动激活,进入可工作状态。
可交易性(Tradeability):技能体具有价格属性,可在市场上买卖、租赁或订阅。交易对象是"能力程序的使用权",而非"行动者的时间"。
可组合性(Composability):多个技能体可通过标准接口编排为复合能力——文案技能体调用数据分析技能体优化标题,烹饪技能体调用营养分析技能体搭配食材。
可继承性(Heritability):技能体不随创建者消失。一个人三十年的手艺被封装为技能体后,可被保存、复制、迭代。人类技能的数字化永续由此成为可能。
具身兼容性(Embodiment Compatibility):技能体通过适配层与具身接口,安装至仿生人脑部后自动对接其基础运动控制程序,成为有机智慧组件。同一技能体在不同规格的仿生人上运行时,自适应校准至该硬件的最优执行参数。
技能体作为可独立流通的能力程序,其权益保护是产业化的核心前提。本节提出唯一载体+不可篡改+三种模式的保护框架。
唯一载体原则(Single Carrier Principle):技能体仅以百工AI平台为唯一合法载体进行分发与交易。任何在百工AI平台之外的分发、转发或二次销售均构成侵权,该技能体在非授权环境下无法正常运行。
不可篡改原则(Tamper-Proof Principle):每个技能体内植入创建者签名与平台签名的双重验证代码。任何对技能体核心逻辑的篡改将导致签名验证失败,技能体自动降级为不可执行状态。这一机制确保技能体的完整性与创建者权益不受侵害。
三种授权模式(Three Licensing Models):
| 模式 | 说明 | 源码可见性 | 使用费用 | 典型场景 |
|---|---|---|---|---|
| 售卖(Sale) | 买方获得永久使用权 | 不公开 | 一次性付费 | 专业技能体(法律、医疗、设计) |
| 租用(Rental) | 买方获得限期使用权 | 不公开 | 按期付费(月/年) | 高价值技能体的短期使用 |
| 公益(Public Good) | 创建者免费发布,用户免费使用 | 不公开 | 免费 | 基础工具类技能体(天气查询、翻译) |
三种模式的共同约束:源码均不公开(区别于开源),技能体仅在百工AI平台运行,转发与二次销售均违法。公益模式的核心区别在于免费但不开放源码——创建者保留知识产权,用户获得免费使用权而非代码访问权。
三层保护体系:
技能体的生命周期包含五个阶段:
技能体作为可安装的自主智能程序体,需要一个承载其运行的操作系统环境。然而,当前存在双重断裂:
数字域断裂:互联网被分割为无数平台孤岛——微信、淘宝、抖音、Gmail、Salesforce——各自独立运营,账号不互通,数据不共享。一个"帮我管理全部社交账号"的需求,在当前架构下无法被任何单一程序满足,因为每个平台都是一座封闭花园。
物理域断裂:仿生机器人缺乏统一的操作系统。ROS/ROS2是中间件框架而非真OS;EAIOS、天工OS、物界OS等新兴系统聚焦物理域的感知-认知-动作闭环,但未涉及数字域的跨平台操作。
双域鸿沟:更关键的是,没有任何现有系统同时管理数字域和物理域。一个技能体要么只能在数字世界操作(如Gemini Spark),要么只能在物理世界执行(如ROS机器人),无法跨域无缝运行。
仿生脑系统(Bionic Brain System, BBS)是一种面向技能体的双域操作系统,同时管理数字域(跨平台账号与数据)和物理域(仿生人硬件与运动控制),使技能体能在数字世界和物理世界中无缝执行。
形式化表示:
BBS = ⟨D, P, S, K⟩
其中:
仿生脑系统不是对EAIOS/ROS的替代,而是层次化叠加:
┌─────────────────────────────────────────────┐
│ 技能体(Skill Body) │ ← 用户安装的能力程序
├─────────────────────────────────────────────┤
│ 仿生脑系统(Bionic Brain System) │ ← 双域OS
│ ┌──────────────┐ ┌──────────────────┐ │
│ │ 数字域管理器 │ │ 物理域管理器 │ │
│ │ (跨平台账号 │ │ (硬件发现/运动 │ │
│ │ 自主操作) │ │ 控制/感知融合) │ │
│ └──────────────┘ └──────────────────┘ │
│ ┌──────────────────────────────────────┐ │
│ │ 技能体运行时 + 安全内核 │ │
│ └──────────────────────────────────────┘ │
├─────────────────────────────────────────────┤
│ EAIOS / ROS2 / 物界OS / 天工OS │ ← 现有物理域OS
├─────────────────────────────────────────────┤
│ Linux / RTOS / Hypervisor │ ← 基础OS
└─────────────────────────────────────────────┘
仿生脑系统在现有物理域OS之上增加数字域管理能力和技能体运行时,使技能体获得"双域通行"能力。
5.4.1 主人授权机制(Master Authorization)
仿生脑系统的最高权限属于主人。主人通过输入账号密码或OAuth授权,将特定平台的操作权限授予仿生脑系统。授权范围可精确控制——只读/读写/交易/管理。技能体的任何跨域操作均需经过授权验证,且主人可随时撤销授权。
5.4.2 跨域操作引擎(Cross-Domain Operation Engine)
当技能体需要跨平台执行任务时,仿生脑系统的数字域管理器负责:
5.4.3 技能体安装与调度(Skill Body Installation and Scheduling)
仿生脑系统的技能体运行时负责:
5.4.4 分层记忆架构(Layered Memory Architecture)
仿生脑系统借鉴生物大脑的记忆分层机制,为技能体提供三级记忆系统:
三级记忆的协作机制:新任务先检索技能记忆(快速匹配),未命中则进入工作记忆执行(审慎处理),执行结果写入经验记忆(积累经验),经验反复验证后固化为技能记忆(形成条件反射)。这一架构使技能体在保持自主性的同时具备人类般的熟能生巧能力。
5.4.5 条件反射机制(Conditioned Reflex Mechanism)
仿生脑系统为物理域技能体提供条件反射机制,确保在紧急场景下的快速安全响应:
生物体的条件反射(如手触滚烫物体时瞬间缩回)不经大脑皮层思考,由脊髓反射弧直接完成——速度远快于有意识决策。同理,仿生脑系统为技能体设定物理域条件反射规则:
条件反射机制是技能体在物理域安全运行的关键保障——在仿生人执行烹饪、驾驶、手术等高风险任务时,毫秒级的反射响应可能避免严重后果。这一设计区别于传统机器人的硬编码安全规则:条件反射由仿生脑系统统一管理,技能体无需各自实现安全逻辑,且反射规则可随经验记忆的积累而扩展。
5.4.6 安全内核(Security Kernel)
仿生脑系统的安全内核确保:
仿生脑系统的实现遵循由简到繁的演进路径:
阶段一:跨域管家(Cross-Domain Butler)——最小可行系统,仅包含数字域管理器的基础功能。用户授权后,跨域管家技能体自主按指令操作全部已授权平台。这是仿生脑系统的"内核启动"。
阶段二:技能体市场(Skill Body Marketplace)——在跨域管家基础上,增加技能体运行时,使第三方技能体可安装运行。百工平台提供技能体的分发、安装和调度。
阶段三:物理域扩展(Physical Domain Extension)——对接EAIOS/ROS等物理域OS,增加物理域管理器,使技能体能在仿生人上执行物理操作。
阶段四:双域融合(Dual-Domain Fusion)——数字域与物理域在统一内核下无缝协同,技能体可同时操作数字平台和物理设备。
跨域智能管理技能体(Cross-Domain Intelligent Management Skill Body,简称"跨域管家")是仿生脑系统的最小可行形态,也是技能体概念的首个应用实例。
用户下载安装跨域管家后,将各平台(微信、淘宝、抖音、Gmail、Outlook等)的账号密码或OAuth令牌授权给它。此后,跨域管家按照主人的自然语言指令,自主登录并操作全部已授权平台——发邮件、管日程、发社交媒体、查订单、处理事务。跨域管家具备初级意识:记住主人偏好、判断操作风险、主动汇报异常、从历史操作中学习优化。
| 维度 | Zapier/Make/n8n | Gemini Spark | ai.com | 跨域管家技能体 |
|---|---|---|---|---|
| 运行模式 | 工作流触发 | 7×24自主运行 | 指令驱动 | 自主运行+指令驱动 |
| 平台覆盖 | API集成(限开放API) | Google生态 | 多App但限合作方 | 用户授权即接入 |
| 接入方式 | 开发者配置API | Google账号绑定 | 合作App连接 | 主人输入账号密码 |
| 可安装性 | 云端SaaS | 云端SaaS | 云端SaaS | 可下载安装的技能体 |
| 自主性 | 规则执行 | 半自主 | 半自主 | 全自主+初级意识 |
| 物理域 | 无 | 无 | 无 | 可扩展至仿生人 |
跨域管家的核心差异在于:
跨域管家的技术架构包含四层:
认证代理层(Authentication Proxy):安全存储主人的各平台凭证,按需完成登录认证。支持密码登录、OAuth授权、Cookie管理等认证方式。凭证经加密存储,技能体运行时解密使用。
平台适配层(Platform Adapter):为每个目标平台实现适配器,将统一的操作意图翻译为平台特定的操作序列。适配器同时支持API调用(优先)和界面自动化(备选)两种模式。
任务执行层(Task Execution):接收主人的自然语言指令,分解为跨平台操作序列,按依赖关系编排执行。具备异常处理、重试机制和结果验证。
学习进化层(Learning & Evolution):从操作历史中学习主人偏好(如"回复邮件时用正式语气"、"抖音发布选晚上8点"),持续优化执行策略。
跨域管家作为持有主人全部平台凭证的技能体,安全是第一要务:
跨域管家被定位为百工AI平台的第001号官方技能体,具有三重战略意义:
概念验证:跨域管家是"技能体"定义的完美实例——技能包教你操作各平台(静态内容,学不会),技能体直接帮你操作(自主程序,装了就能干)。用户安装后立即可感知技能体与技能包的本质区别。
冷启动产品:跨域管家解决了一个真实的高频痛点——跨平台操作的繁琐与割裂。作为百工平台的第一个技能体,它具有天然的获客吸引力。
仿生脑系统起点:跨域管家是仿生脑系统演进路径的阶段一。后续所有技能体都运行在跨域管家所承载的仿生脑系统之上——跨域管家不仅是第一个技能体,也是技能体运行环境本身。正如Linux内核既是第一个运行在Linux上的程序,也是所有后续Linux程序的基础。
当技能体程序被安装至仿生人脑部计算单元时,经历以下自动对接过程:
一个烹饪技能体可以被安装到:
同一个能力内核,不同的物理载体,通过自适应校准产生不同的执行特征——正如同一首乐谱由不同乐器演奏,旋律相同,音色各异。
在仿生脑系统上运行的技能体可分为三类:
纯数字域技能体(L1):如文案写作技能体、数据分析技能体——仅在数字域运行,操作信息与数据。跨域管家即属此类。
纯物理域技能体(L2-L5):如烹饪技能体、清洁技能体——仅在物理域运行,通过仿生人执行物理操作。
双域技能体:如"家庭管家技能体"——同时操作数字域(管理邮件、支付账单)和物理域(做饭、打扫),在仿生脑系统的统一调度下实现数字-物理无缝协同。这是技能体的终极形态——真正实现"一个程序,两个世界"。
技能包→智能体→技能体构成能力载体的三层递进:
第一层:技能包——"关于怎么做的内容"。静态的、被动的、需外部驱动。知识的外化形态。在百工平台上,以内容商品形式交易。
第二层:智能体——"谁来做"。完整的行动者,能力绑定于行动者内部。行动的外化形态。
第三层:技能体——"自己就能做的程序"。自主的、可安装的、可流通的。能力的外化形态——能力第一次脱离行动者独立存在。在百工平台上,以程序授权形式交易。
这三层不是替代关系,而是并存关系。技能包仍然有价值(参考知识),智能体仍然有价值(行动框架),技能体开辟了新的维度(独立能力实体)。百工平台同时交易技能包与技能体,正是这种并存关系的市场体现。
| 类比域 | 技能包 | 智能体 | 技能体 |
|---|---|---|---|
| 交通 | 路线图(告诉你怎么走) | 出租车(带你去目的地) | 自动驾驶程序(自己能开车) |
| 医疗 | 医学教科书 | 全科医生 | 专科手术程序(可安装到任何手术机器人) |
| 音乐 | 乐谱 | 乐队 | 可移植的演奏算法(安装到任何乐器自动演奏) |
| 编程 | 技术文档 | 开发团队 | 可部署的微服务(独立运行、可组合) |
| 操作系统 | 用户手册 | 系统管理员 | 仿生脑系统(跨域管家=最小OS) |
跨域管家技能体在功能上等价于一个最小化操作系统:
| 操作系统功能 | 传统OS | 跨域管家技能体 |
|---|---|---|
| 资源管理 | CPU/内存/磁盘 | 各平台账号/数据/服务 |
| 进程调度 | 多任务优先级 | 多任务排队与并发执行 |
| I/O抽象 | 统一硬件驱动 | 统一各平台API/界面适配 |
| 内存管理 | RAM分配与回收 | 上下文/偏好/历史记忆管理 |
| 权限控制 | 用户/组/读写 | 主人授权/操作白名单/风险审批 |
| 文件系统 | 目录树与索引 | 跨平台数据统一存取 |
跨域管家 = 仿生脑系统的内核启动 = 技能体操作系统的最小可行版本。正如Linux内核既是OS的第一个程序也是所有程序的基础,跨域管家既是第一个技能体也是技能体运行环境本身。
技能体作为具有独创性的智力创造成果,符合版权法保护要件:
不同创建者可以为同一类能力创建不同版本的技能体——"川菜烹饪技能体·陈师傅版"与"川菜烹饪技能体·王师傅版"各有独特技艺与风格,各自可注册版权。技能体的版权保护的是"能力的程序化表达",而非能力本身——正如菜谱的版权保护的是文字表达而非烹饪方法。
技能包与技能体在百工平台上各有适合的商品化模式:
技能包商品化:
技能体商品化——三种授权模式(详见4.3节):
三种模式的共同约束:技能体仅在百工AI平台运行,转发与二次销售均违法(唯一载体原则)。创建者与平台植入双重签名保护代码(不可篡改原则)。
百工AI平台作为技能包与技能体的交易市场,核心功能包括:
| 阶段 | 时代 | 核心外化 | 本质 | 类比 |
|---|---|---|---|---|
| 1 | 工具时代 | 物理能力的被动延伸 | 人→工具 | 锤子延伸手臂 |
| 2 | 电脑时代 | 逻辑运算的外包 | 人→计算 | 算盘→ENIAC |
| 3 | 网络时代 | 信息与协作的去中心化 | 单机→网络 | 一台→全球 |
| 4 | 人工智能时代 | 认知能力的机器化 | 感知→判断 | 识别→决策 |
| 5 | 智能体时代 | 完整行动链条的委托 | 理解→执行 | 目标→交付 |
| 6 | 技能体时代 | 自主能力程序的独立与流通 | 绑定→独立·静态→自主 | 手艺→可安装程序 |
| 7 | 技能网络时代 | 能力的互联网 | 单体→网络 | 技能找技能 |
| 8 | 文明传承时代 | 人类技能的数字化永续 | 随人→永续 | 绝技不灭 |
第6阶段的特殊性在于,它同时完成了三重解放:
当技能体数量足够多、标准化足够成熟,它们之间开始自主发现、互相调用与自动编排——文案技能体自主调用数据分析技能体优化标题,烹饪技能体自主调用营养分析技能体搭配食材,法律技能体自主调用合同审查技能体验证条款。从"人找技能"到"技能找技能",形成比任何单个智能体都强大的协作网络。
一个人花三十年练出的手艺,随着他去世就消失了。但如果这种能力被封装为技能体——不仅是记录"他怎么做的"(那是技能包),而是创建"自己就能像他一样做"的自主程序——那么他的能力可以超越肉体和时间被保存、复制、迭代。木匠的榫卯手艺、老中医的辨证经验、名师的授课节奏,不再随人而去。技能体使人类技能的数字化永续从"记录"升级为"重生"。
在仿生脑系统上,技能体网络产生独特的双域协同效应:数字域技能体处理信息后触发物理域技能体执行操作——"邮件中收到客户订单→数据分析技能体解析需求→生产调度技能体编排产线→装配技能体在仿生人上执行组装"。数字与物理的闭环不再是人类的专利,而是技能体网络的固有运行模式。
本文提出三大核心概念及它们之间的关系:
三者关系:跨域管家是仿生脑系统的阶段一,仿生脑系统是技能体的运行环境,技能体是百工平台的交易物。从跨域管家到仿生脑系统到技能体网络,构成一条完整的演进路径。
未来研究方向:
[1] Varela, F. J., Thompson, E., & Rosch, E. (1991). The Embodied Mind: Cognitive Science and Human Experience. MIT Press.
[2] Stelmaszak, M., Joshi, M., & Constantiou, I. (2025). Artificial Intelligence as an Organizing Capability Arising from Human-Algorithm Relations. Journal of Management Studies. https://doi.org/10.1111/joms.70003
[3] Zhou, J. et al. (2026). A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and Applications. arXiv:2605.07358.
[4] Anthropic (2025). Claude Skills: Making AI Agents More Capable. https://www.anthropic.com
[5] 中国工程院 (2026). 具身智能发展趋势与展望. 中国工程科学, 2026(2).
[6] 工业和信息化部, 国务院国资委 (2026). 2026年度人形机器人与具身智能实景实训专项行动通知.
[7] NVIDIA (2024). Physical AI: The Next Frontier. Huang, J. Keynote at COMPUTEX.
[8] Pudu Robotics (2026). PuduFM 1.0 and PuduAgent: One Brain, Multiple Embodiments. https://www.roboticsbusinessnews.com
[9] Kuhn, T. S. (1962). The Structure of Scientific Revolutions. University of Chicago Press.
[10] 乐小野 (2026). 10篇论文看懂AI智能体Skill的表示、执行、评估与进化. 腾讯云开发者社区.
[11] CCF泛在操作系统开放社区 (2026). 具身智能操作系统技术白皮书(EAIOS).
[12] 合十思维 (2026). 物界OS双脑架构具身系统及Humanoid-X发布会. 新浪科技, 2026-06-01.
[13] CSDN (2026). 从ROS到Cognitive OS、Agentic OS: 机器人操作系统与具身智能新时代. 2026-06-10.
[14] ROSClaw (2026). ROSClaw: Physical Intelligence Open Infrastructure. GitHub: ros-claw/rosclaw. MIT License.
[15] Google (2026). Gemini Spark: Always-On Personal AI Agent. https://blog.google
[16] ai.com (2026). Personal AI Agent Platform. Founded by Kris Marszalek.
本文提出的"技能体""仿生脑系统""跨域智能管理技能体"三个概念由吴信能(Wu Xinneng,肥东县古城学校)于2026年6月首次提出并系统阐述。概念首发于百工AI平台(skillbay.cn)。AI辅助文献检索与文本整理,核心概念与理论框架由作者独立提出。