硬件抽象 · 一次开发四处运行
把推理后端抽象成统一接口,业务代码只调 predict,底层在 NVIDIA、华为昇腾、海光、CPU 之间自由切换,环境变量一改即生效。
看 · 判 · 记三合一闭环
高置信样本视觉直通,低置信样本视觉大模型兜底,合规硬规则把关,人工审批可介入,执行结果毫秒落库。
国产化原生 · 等保三级
出厂自带麒麟 V10 SP3 ARM64 镜像、华为昇腾 910B / 310B 推理、达梦 / OceanBase 数据库、单向网闸友好,无需外联依赖。
业务层零感知切换 NVIDIA / 昇腾 / 海光 / CPU。
| from factoryos_inference import InferenceClient, InferenceInput |
| import numpy as np |
| # 自动探测最佳后端 (NVIDIA / 华为昇腾 / 海光 DCU / 通用 CPU) |
| client = InferenceClient() |
| client.load_model("yolo_defect_v3") |
| # 构造推理输入 |
| image = np.random.rand(1, 3, 640, 640).astype(np.float32) |
| inp = InferenceInput(data=image) |
| # 执行推理 |
| out = client.predict("yolo_defect_v3", inp) |
| print(f"backend={out.backend.value} latency={out.latency_ms:.1f}ms") |
| for det in out.detections: |
| print(f" {det.label}: {det.score:.3f} @ {det.bbox}") |
每瓶可反查 AI 推理证据链,飞检官点哪瓶查哪瓶。