3、系统架构

NebulaAI 系统架构图

1. 架构总览 (System Architecture Overview)

本系统(NebulaAI)采用 “端-云-脑”一体化 的分层微服务架构。系统自上而下分为 应用层(交互与生态)服务层(支撑与中间件)智能体底座(核心认知引擎) 以及 LLM 接口层(模型算力)。该架构通过高内聚低耦合的设计,实现了从用户交互前端(React/Next.js)到异构大模型后端(Python/Hybrid LLMs)的全链路打通,确保了平台的高扩展性与企业级数据一致性。


2. 详细分层设计

2.1 应用层 (Application Layer) —— 交互中心与生态构建

本层基于 Next.js/React 构建,负责具体业务场景的呈现与人机交互,通过组件化设计支持灵活的功能扩展。

  • 生态与管理 (App Store & Management):
    • 应用商店 & 插件中心: 建立基于 React 组件的开放市场,允许开发者通过标准化接口发布 Agent 技能与前端 UI 组件。
    • 应用管理 & 用户管理: 提供多租户管理后台,基于 MySQL 存储企业组织架构、角色权限(RBAC)及计费策略。
  • 交互形式 (Smart Interface):
    • 智能卡片 (Smart Cards): 利用 Next.js 的服务端渲染(SSR)能力,动态生成可视化数据卡片(如报表、图表),超越纯文本对话体验。
    • 工作流 (Workflows): 提供低代码(Low-Code)可视化画布,允许用户通过拖拽编排 Agent 的任务链路。
  • 业务逻辑扩展:
    • 云函数 (Cloud Functions): 集成 Python Serverless 运行时,支持用户编写自定义 Python 脚本作为 Agent 的动态能力扩展。
    • 长期记忆 (Long-term Memory UI): 可视化展示用户的历史画像与偏好设置。

2.2 服务层 (Service Layer) —— 基础设施与中间件

本层作为系统的稳定支撑层,通过 Python 后端服务 提供通用能力,确保系统的高可用与安全性。

  • 安全与通信:
    • 鉴权 (Auth): 统一网关层,支持 JWT/OAuth2.0 认证,确保 API 调用与 WebSocket 连接的安全性。
    • API 调用 & Mock 服务: 标准化 RESTful/gRPC 接口封装,支持第三方系统集成,并提供 Mock 能力以便于前后端并行开发与测试。
  • 多模态支持:
    • 音视频 (Audio/Video): 处理语音转文字(STT)与文字转语音(TTS)流,支持多模态输入输出。
  • 高性能数据基座:
    • 缓存与存储 (Cache & Storage):
      • 采用 Redis 缓存会话热数据(Session State)与 API 响应,实现毫秒级响应。
      • 采用 MySQL 实现业务数据的持久化存储,保障数据强一致性(ACID)。

2.3 智能体底座 (Agent Foundation) —— 核心认知引擎

本层是 NebulaAI 的“大脑”,由 Python 深度开发,集成了思维链(CoT)与向量检索技术。

  • 认知调度:
    • 智能编排 (Orchestration): 基于 ReAct 或 TOT(Tree of Thoughts)范式,分析用户意图,动态拆解任务步骤。
    • 执行计划 (Planning): 自动生成分步执行路径,并在每一步执行后进行结果验证与自我修正。
  • 记忆与知识增强 (Memory & RAG):
    • RAG 检索: 集成 FAISS 向量数据库,构建高维稠密检索系统。对企业文档进行切片 Embedding,实现私有领域知识的精准召回。
    • 核心记忆 (Core Memory): 维护短期上下文窗口,动态压缩与剪枝(Pruning)对话历史,确保 Prompt 不超限且保留关键信息。
  • 能力扩展:
    • 工具注册 (Tool Registration): 定义标准化的 Python Decorators,自动将本地函数、API 接口转化为 LLM 可理解和调用的工具(Tools)。

2.4 模型接口层 (OpenAI / LLM Interface) —— 异构模型网关

本层实现了“模型中立”策略,通过 Model Gateway 统一封装,屏蔽了底层各厂商的技术差异。

  • 统一协议 (Unified Interface):
    • 基于 OpenAI SDK 标准格式 封装所有模型接口,支持流式输出(Streaming),便于上层业务无缝切换模型。
  • 混合模型调度 (Hybrid Routing):
    • 本地私有化 (Local/Edge): 对接 Ollama 运行 Llama3/Mistral 等模型,用于处理隐私敏感数据或高频低成本任务。
    • 云端高性能 (Cloud SaaS): 路由复杂逻辑任务至 Azure OpenAIOpenAI (GPT-4)Claude
    • 国产化合规 (China Native): 深度适配 Qwen (通义千问)Qianfan (百度千帆)讯飞星火,满足国内业务合规与中文理解需求。

3. 技术栈映射摘要

架构层级图示模块映射核心技术栈
应用层插件管理、应用商店、智能卡片、工作流Next.js / React (SSR, Streaming UI)
服务层鉴权、API 调用、缓存与存储Python (Backend Framework), Redis (Cache), MySQL (DB)
底座层RAG 检索、核心记忆、智能编排Python (Logic), FAISS (Vector DB), LangChain/Self-developed Core
模型层LLM Interface、Qwen/Ollama/AzureModel Gateway (Python Adapters for OpenAI/Azure/Ollama/Qwen/etc.)

这个架构描述完美契合了 NebulaAI 的图片结构,展现了从底层数据处理、模型推理到上层应用分发的完整技术图谱,既体现了系统的复杂度和专业性,又突出了您选用的技术栈的先进性。