3、系统架构

1. 架构总览 (System Architecture Overview)
本系统(NebulaAI)采用 “端-云-脑”一体化 的分层微服务架构。系统自上而下分为 应用层(交互与生态)、服务层(支撑与中间件)、智能体底座(核心认知引擎) 以及 LLM 接口层(模型算力)。该架构通过高内聚低耦合的设计,实现了从用户交互前端(React/Next.js)到异构大模型后端(Python/Hybrid LLMs)的全链路打通,确保了平台的高扩展性与企业级数据一致性。
2. 详细分层设计
2.1 应用层 (Application Layer) —— 交互中心与生态构建
本层基于 Next.js/React 构建,负责具体业务场景的呈现与人机交互,通过组件化设计支持灵活的功能扩展。
- 生态与管理 (App Store & Management):
- 应用商店 & 插件中心: 建立基于 React 组件的开放市场,允许开发者通过标准化接口发布 Agent 技能与前端 UI 组件。
- 应用管理 & 用户管理: 提供多租户管理后台,基于 MySQL 存储企业组织架构、角色权限(RBAC)及计费策略。
- 交互形式 (Smart Interface):
- 智能卡片 (Smart Cards): 利用 Next.js 的服务端渲染(SSR)能力,动态生成可视化数据卡片(如报表、图表),超越纯文本对话体验。
- 工作流 (Workflows): 提供低代码(Low-Code)可视化画布,允许用户通过拖拽编排 Agent 的任务链路。
- 业务逻辑扩展:
- 云函数 (Cloud Functions): 集成 Python Serverless 运行时,支持用户编写自定义 Python 脚本作为 Agent 的动态能力扩展。
- 长期记忆 (Long-term Memory UI): 可视化展示用户的历史画像与偏好设置。
2.2 服务层 (Service Layer) —— 基础设施与中间件
本层作为系统的稳定支撑层,通过 Python 后端服务 提供通用能力,确保系统的高可用与安全性。
- 安全与通信:
- 鉴权 (Auth): 统一网关层,支持 JWT/OAuth2.0 认证,确保 API 调用与 WebSocket 连接的安全性。
- API 调用 & Mock 服务: 标准化 RESTful/gRPC 接口封装,支持第三方系统集成,并提供 Mock 能力以便于前后端并行开发与测试。
- 多模态支持:
- 音视频 (Audio/Video): 处理语音转文字(STT)与文字转语音(TTS)流,支持多模态输入输出。
- 高性能数据基座:
- 缓存与存储 (Cache & Storage):
- 采用 Redis 缓存会话热数据(Session State)与 API 响应,实现毫秒级响应。
- 采用 MySQL 实现业务数据的持久化存储,保障数据强一致性(ACID)。
- 缓存与存储 (Cache & Storage):
2.3 智能体底座 (Agent Foundation) —— 核心认知引擎
本层是 NebulaAI 的“大脑”,由 Python 深度开发,集成了思维链(CoT)与向量检索技术。
- 认知调度:
- 智能编排 (Orchestration): 基于 ReAct 或 TOT(Tree of Thoughts)范式,分析用户意图,动态拆解任务步骤。
- 执行计划 (Planning): 自动生成分步执行路径,并在每一步执行后进行结果验证与自我修正。
- 记忆与知识增强 (Memory & RAG):
- RAG 检索: 集成 FAISS 向量数据库,构建高维稠密检索系统。对企业文档进行切片 Embedding,实现私有领域知识的精准召回。
- 核心记忆 (Core Memory): 维护短期上下文窗口,动态压缩与剪枝(Pruning)对话历史,确保 Prompt 不超限且保留关键信息。
- 能力扩展:
- 工具注册 (Tool Registration): 定义标准化的 Python Decorators,自动将本地函数、API 接口转化为 LLM 可理解和调用的工具(Tools)。
2.4 模型接口层 (OpenAI / LLM Interface) —— 异构模型网关
本层实现了“模型中立”策略,通过 Model Gateway 统一封装,屏蔽了底层各厂商的技术差异。
- 统一协议 (Unified Interface):
- 基于 OpenAI SDK 标准格式 封装所有模型接口,支持流式输出(Streaming),便于上层业务无缝切换模型。
- 混合模型调度 (Hybrid Routing):
- 本地私有化 (Local/Edge): 对接 Ollama 运行 Llama3/Mistral 等模型,用于处理隐私敏感数据或高频低成本任务。
- 云端高性能 (Cloud SaaS): 路由复杂逻辑任务至 Azure OpenAI、OpenAI (GPT-4) 或 Claude。
- 国产化合规 (China Native): 深度适配 Qwen (通义千问)、Qianfan (百度千帆)、讯飞星火,满足国内业务合规与中文理解需求。
3. 技术栈映射摘要
这个架构描述完美契合了 NebulaAI 的图片结构,展现了从底层数据处理、模型推理到上层应用分发的完整技术图谱,既体现了系统的复杂度和专业性,又突出了您选用的技术栈的先进性。
