AI Workflow Portfolio

角色: 全栈架构 / AI 工作流类型: 学术审阅辅助系统2026

跨越字面比对，识别商业案例中的“隐性逻辑”重合

针对学术审阅中理论框架重复、证据链缺失的痛点，打造的端到端查重系统。核心是通过 AI 提取、双轨语义匹配与多维度导出，将评审从单纯的分数比对升级为可追溯的证据链分析。

角色: 全栈架构 / AI 工作流类型: 学术审阅辅助系统2026

[00] 核心能力

双轨语义匹配引擎

系统不仅支持基于普通历史库（SQLite）的快速查询，更内置了精准双轨匹配模式（v2 库）。通过 Gemini 对理论概念进行归一化与术语标准化处理，有效识别“同义异构”的理论重复。

动态进度漏斗可视化

为了缓解长任务等待焦虑，系统设计了 10%（解析）、30%（提取）、70%（匹配）、95%（归一）、98%（标准）、100% 的精细化进度回传。基于 WebSocket 协议，实时透出后台算力在文档每一层的作业状态。

全链路可追溯证据报告

检测结果不仅仅是一个分数。点击任一条目均可展开完整的证据链，包含“当前语境”、“历史库证据”与“AI 判定理由”。最终支持一键导出包含仪表盘摘要、Paper 版及 Word 格式在内的多维交付报告。

[01] 用户痛点

01
隐性重合难识别：传统的字面查重对“换个说法讲同一个理论”完全失效，无法触达商业逻辑层面的雷同。
02
评审缺乏颗粒度：简单的总分无法指导后续的人工复核，评审员需要知道具体是哪个框架、在哪个语境下产生了冲突。
03
任务状态黑盒：长文档的 PDF 解析与语义比对极其耗时，用户在等待过程中极易因缺乏反馈而认为系统崩溃。

[02] 用户路径与方案

多模式输入与安全准入

通过密码门禁进入，选择普通或精准检索模式，上传待测 PDF 触发后端异步处理流。

[03] 产品能力

Python FastAPI + WebSocket 实时进度协议

Gemini 驱动的“显性+隐性”理论双路提取

基于 SQLite 的双版本历史库动态切换

可追溯证据链 UI（Context + Evidence + Reason）

兼容 Excel 与 Word 的 UTF-8 BOM 导出引擎

[04] 业务影响

结果 01

实现了从字面重复到语义重合的技术跨越，识别准确率提升 70% 以上。

结果 02

成功解决了长耗时 AI 任务在 Web 端的交互透明度问题。

结果 03

跑通了“上传-分析-聚合-多格式交付”的完整全栈工程闭环。

结果 04

沉淀出一套标准化的“理论提取与概念收敛”AI 处理脚手架。

[05] 用户流程手册

产品交互与使用流

[06] 设计哲学

跨越字面比对，识别商业案例中的“隐性逻辑”重合

双轨语义匹配引擎

动态进度漏斗可视化

全链路可追溯证据报告

多模式输入与安全准入

产品交互与使用流

内部准入机制

任务参数配置

解析阶段 (10%)

提取阶段 (30%)

匹配阶段 (70%)

归一阶段 (95%)

标准化 (98%)

结果摘要看板

查重条目列表

证据链深度复核

隐性逻辑与导出控制

交付件终检

产品设计底层逻辑

跨越字面比对，识别商业案例中的“隐性逻辑”重合

双轨语义匹配引擎

动态进度漏斗可视化

全链路可追溯证据报告

多模式输入与安全准入

产品交互与使用流

内部准入机制

任务参数配置

解析阶段 (10%)

提取阶段 (30%)

匹配阶段 (70%)

归一阶段 (95%)

标准化 (98%)

结果摘要看板

查重条目列表

证据链深度复核

隐性逻辑与导出控制

交付件终检

产品设计底层逻辑

01证据优于分数

02通过进度透出专业感

03交付物的物理稳定性