产品架构

三层一栈 · SDK + 决策大脑 + 信创栈

底层推理 SDK、中层决策大脑、上层合规审计,一份代码、四套硬件、双栈交付。

三层结构,各司其职

硬件抽象 · 一次开发四处运行

推理 SDK

把推理后端抽象成统一接口,业务代码只调 predict,底层在 NVIDIA、华为昇腾、海光、CPU 之间自由切换,环境变量一改即生效。

  • 视觉识别 50 毫秒响应
  • 视觉大模型 200 毫秒复核
  • 信创硬件零改动适配
  • CI 环境 CPU 跑测试

看 · 判 · 记三合一闭环

决策大脑

高置信样本视觉直通,低置信样本视觉大模型兜底,合规硬规则把关,人工审批可介入,执行结果毫秒落库。

  • 300 毫秒内出剔除、复检、放行三档决定
  • 每条决策附中文判定理由
  • GMP 黑白名单硬规则把关
  • 人工审批节点可挂起、可恢复

国产化原生 · 等保三级

信创栈

出厂自带麒麟 V10 SP3 ARM64 镜像、华为昇腾 910B / 310B 推理、达梦 / OceanBase 数据库、单向网闸友好,无需外联依赖。

  • 麒麟操作系统原生镜像
  • 华为昇腾推理一键切换
  • 国产数据库适配
  • 等保三级文档随产品交付

两行代码完成推理接入

业务层零感知切换 NVIDIA / 昇腾 / 海光 / CPU。

from factoryos_inference import InferenceClient, InferenceInput
import numpy as np
# 自动探测最佳后端 (NVIDIA / 华为昇腾 / 海光 DCU / 通用 CPU)
client = InferenceClient()
client.load_model("yolo_defect_v3")
# 构造推理输入
image = np.random.rand(1, 3, 640, 640).astype(np.float32)
inp = InferenceInput(data=image)
# 执行推理
out = client.predict("yolo_defect_v3", inp)
print(f"backend={out.backend.value} latency={out.latency_ms:.1f}ms")
for det in out.detections:
print(f" {det.label}: {det.score:.3f} @ {det.bbox}")

电子批记录 · 单页可打印

每瓶可反查 AI 推理证据链,飞检官点哪瓶查哪瓶。

SHA-256 数字签名,防篡改
Audit Trail 全链路时间戳
Electronic Signature 双合规
中文判定理由 + 原图证据

部署形态 · OT 域独立网络

数据完全不出厂,IT 与 OT 物理隔离,单向网闸进数据。

50 ms

视觉识别

200 ms

VLM 复核

300 ms

决策出结果

0.05%

漏检率