安徽高速收费稽查大模型

基于大模型的“决策、执行、洞察”一体化智能体

2025-11-09 20:59:45
申报单位:安徽皖通高速公路股份有限公司、安徽交控信息产业有限公司
投上一票  

  1、项目总体介绍

  当高速公路一线收费员困惑“甲鱼算绿通吗?”,当管理者想知道“宿州上个月堵漏增收多少?”,当稽查员怀疑“这辆车有没有逃费?”... 过去,这些问题的答案需要翻阅厚厚的法规、等待数小时的报表、或进行复杂的人工研判。现在,他们只需问“小美”。

  本项目推出业内首个真正意义上的一体化稽查AI助手——“小美”(Highway Audit AI-Agent)。她不仅仅是一个问答机器人,而是一个深度融合了大语言模型(LLM)与行业知识,集“决策支持”、“业务执行”与“风险洞察”于一身的智能体(Agent)。“小美”的核心由三大能力模块构成:

   她能像BI专家一样, 将管理者的自然语言指令秒级转化为数据洞察,使数据获取效率从小时级提升至分钟级;

   她能像一线法规专家一样, 对政策查询实现精准、可溯源的秒级响应,准确率超98%;

   她更能像一名资深分析师一样, 主动思考、深度研判,发现传统手段难以识别的团伙性、隐蔽性逃费行为。

  “小美”是“人工智能+交通运输”行动的标杆实践,其技术路线清晰、安全合规性强,具备在全国范围快速复制和向交通全领域拓展的巨大潜力。

  2、主要做法

  2.1 系统架构

  2.1.1 架构设计总览

  为支撑“安徽高速收费稽查大模型”高效、稳定、安全地运行,设计了一套遵循云原生理念、基于微服务的现代化系统架构。该架构的核心设计哲学是“高内聚、低耦合”与“能力服务化、调用智能化”。通过将不同功能的智能体(Agents)和底层AI模型解耦为独立的服务,确保了系统的极致弹性、高可用性以及未来业务的无限扩展能力。

  整个架构在逻辑上清晰地划分为五层,实现了从用户交互到数据处理的端到端闭环,并内置了金融级的安全防护与全方位的运维监控体系。

  2.1.2 逻辑架构图

  逻辑架构如下,包括系统分层、核心组件及数据与控制流的交互路径。此架构图反映了“小美”智能应答系统各核心组件间的逻辑关联与交互流程。

  2.1.3 各层详细说明

  一、用户交互层 (Presentation Layer):

  作为用户与系统交互的唯一入口,本层采用响应式设计,适配PC和移动端。前端框架选用Vue 3,通过统一的UI组件库,为不同角色的用户(管理层、一线人员)提供简洁、友好、一致的操作体验。交互以自然语言对话为主,辅以丰富的可视化图表和操作按钮。

  二、统一网关与调度层 (Gateway & Dispatcher Layer):

  本层是系统的“神经中枢”,负责请求的智能分发和安全管控。

  (1) API网关 (API Gateway):基于Spring Cloud Gateway构建,承担了身份认证、权限校验、流量控制、熔断降级、请求路由等职责,是系统安全的第一道防线。

  (2) 意图识别与任务调度中心:“小美”的智能总机,负责理解用户意图并派发给对应的专家模块(即三大Agent)。这是架构的一大创新点。当用户输入“分析一下去年假冒绿通车的分布情况”时,该中心首先利用一个轻量级分类模型或调用LLM的特定能力,精准识别用户意图(数据分析查询)。随后,它将请求及解析出的实体参数(时间、指标、维度)封装,并智能路由到BI-Agent服务的对应API接口。此设计将前端与后端业务逻辑完全解耦,使得未来新增Agent或新功能时,只需在调度中心注册即可,无需改动前端代码。

  三、智能体应用层 (Agent Layer):

  系统的核心业务处理层,三大智能体作为独立的微服务运行。

  微服务设计:独立部署与迭代(升级Expert-Agent不影响BI-Agent的运行)、技术异构性(各Agent可采用最适合自身业务的语言和框架)、资源隔离与弹性伸缩(可根据BI-Agent的计算密集型特点和Expert-Agent的I/O密集型特点,为其分配不同的资源并独立扩容)。

  服务间通信:同步调用(如用户问答)主要通过RESTful API实现;对于异步任务(如Insight-Agent的定时批量扫描),则通过RabbitMQ消息队列进行任务派发和结果回传,避免长时间阻塞,提升系统吞吐量。

  四、模型服务层 (Model Service Layer):

  将底层AI能力从业务逻辑中剥离,沉淀为标准化的模型服务。

  (1) 大语言模型服务:将通义千问等国产大模型进行私有化部署,通过vLLM等高性能推理框架对外提供服务。这种部署方式既保障了数据不出域的安全性,也便于未来对模型进行统一升级或替换。

  (2) 向量化与检索引擎服务:基于Milvus构建,提供文档向量化存储和高效语义检索的API。业务逻辑层只需调用API即可,无需关心底层复杂的向量计算和索引维护。

  (3) 多模态识别服务:封装了OCR、图像识别等算法,以标准API形式提供服务,例如“传入图片URL,返回识别出的车型和轴数”。

  五、数据资源层 (Data Layer):

  采用“按需择库”的原则,为不同类型的数据选择最合适的存储方案。

  (1) 关系型数据库 (PostgreSQL):存储结构化的业务数据,如稽核工单、用户配置等,利用其事务特性保证数据一致性。

  (2) 向量数据库 (Milvus):存储政策法规、操作手册等知识库的向量化数据,支撑Expert-Agent的高效语义检索。

  (3) 数据仓库 (ClickHouse):专为BI-Agent的在线分析处理(OLAP)场景设计。每日将收费流水等海量数据同步至ClickHouse,其列式存储和超凡的查询性能,确保了对亿级数据的多维分析请求能实现秒级响应。

  (4) 对象存储 (MinIO):存储非结构化数据,如门架抓拍图片、用户上传的附件等。

  2.1.4 数据流图

  从用户交互到最终价值输出的全链路过程。整个流程以用户为起点,通过智能化的调度与分析,最终形成一个反馈闭环。

  起点(用户交互):系统面向两类核心用户——管理层与一线人员。用户通过统一的前端界面,以自然语言(如语音或文本)发起请求。

  核心枢纽(AI调度中心):所有用户请求首先进入“AI调度中心”。该中心如同一位智能总管,它首先进行意图识别,准确判断用户的真实需求是数据分析、政策查询还是风险洞察。

  分支处理(三大智能体):根据识别出的意图,任务被精准分发到对应的三大智能体(Agent)并行处理:

  决策支持BI智能体 (BI-Agent):当意图为数据分析时,该智能体启动。它通过核心的Text-to-SQL技术,将自然语言查询转化为SQL代码,从业务数据库(DB)中提取数据,并自动生成交互式报表,供管理层决策。

  一线业务专家智能体 (Expert-Agent):当意图为政策咨询时,该智能体被激活。它运用RAG(检索增强生成)技术,从海量的政策知识库中检索最相关的信息,并结合大语言模型生成精准、可溯源的答案,为一线人员赋能。

  主动稽核洞察智能体 (Insight-Agent):该智能体更具前瞻性。它不仅响应特定查询,更会主动、周期性地扫描业务数据库。通过融合专家规则与机器学习(ML)算法,它能主动发现潜在的逃费线索,并生成稽核洞察报告,实现从被动响应到主动预警的转变。

  终点(价值输出):所有智能体的处理结果——无论是报表、答案还是洞察报告——都会返回给相应的用户,为其工作提供直接、高效的数据和智能支持,从而形成一个从业务中来、到业务中去的完整价值闭环。

  2.2 基础数据集描述

  为了让‘小美’成为名副其实的行业专家,本项目为她打造了一个TB级的、高时效性的专属‘数据粮仓’。数据是驱动人工智能的“血液”。本项目成功构建了一个TB级、多源异构、高时效性的高速公路稽核专题数据资产库。该资产库不仅是三大智能体(AI-Agents)赖以运行的基石,其本身的设计、治理与安全保障体系也构成了本方案的核心竞争力之一。项目遵循“合法采集、最小必要、全周期管理”的原则,将原始业务数据转化为可信、可用、可控的智能数据资源,为大模型在交通行业的深度应用奠定了坚实基础。

  2.2.1数据来源与构成

数据类别 数据来源 日均增量/总量 核心内容与字段(示例) 在系统中的作用
联网收费业务数据 安徽省高速公路联网收费中心 日均约2000万条 通行记录(时间、出入口)、门架交易数据(抓拍图片、识别车牌、轴型)、ETC交易流水、车辆信息(车型、车种) Insight-Agent和BI-Agent的核心分析对象,用于逃费行为模式识别与宏观统计。
稽核业务过程数据 省/市级稽核业务平台 累计超300万条工单/案卷 工单信息、案卷状态、追缴记录、申诉材料、逃费类型标签(大车小标、假冒绿通等)、处置案例详情 Insight-Agent的重要训练样本和分析依据;BI-Agent的案卷分析数据源。
政策法规知识库 国家/地方交通主管部门、官方发布 累计超500份文件,百万字级 《收费公路管理条例》、车型分类标准、绿通目录、节假日免费政策、操作细则、问答集、地方法规及解读文件 Expert-Agent的核心知识来源,通过RAG技术为用户提供精准问答和政策溯源。
外部补充数据 交通运输部官网、安徽省交通厅官网、高德/百度地图API 动态更新 行业统计报告、新闻资讯、路网拓扑结构数据、实时/预测路况 为BI-Agent提供宏观背景知识,为Insight-Agent的路径分析提供辅助。
 

  2.2.2数据处理与生命周期管理

  为将原始的多源数据转化为AI模型可用的高质量“燃料”,本项目设计并实现了一套完整的、自动化的数据处理与生命周期管理流水线。

  一、数据接入与集成 (Data Ingestion & Integration):

  实时流式接入:对于联网收费系统产生的通行记录、门架交易等高时效性数据,采用Kafka消息队列进行实时订阅和消费,确保数据延迟在秒级以内。

  批量ETL处理:对于稽核业务系统数据和外部统计报告,设计了每日/每周执行的ETL(Extract-Transform-Load)作业,通过数据交换平台接口或SFTP进行批量抽取、转换和加载。

  API动态调用:针对路网拓扑、天气等外部数据,通过调用标准API接口,实现按需动态获取,保证信息的现势性。

  二、数据清洗与标准化 (Data Cleansing & Standardization):

  一致性处理:对不同来源的同一实体(如收费站名称、车辆类型编码)进行标准化映射,解决“同物异名”问题。

  缺失值与异常值处理:针对门架数据中常见的“识别车牌为‘无车牌’”、“轴型识别错误”等情况,结合上下文信息(如前后门架数据)进行智能修复或标记。对明显不合理的数值(如通行费为负)进行识别和处理。

  格式转换:将非结构化的政策文档(PDF, Word)通过智能文档处理技术,解析为保留了章节、表格、标题等结构化信息的JSON格式,为后续的知识库构建打下基础。

  三、数据丰富与特征工程 (Data Enrichment & Feature Engineering):

  衍生特征计算:在原始数据基础上,计算一系列高价值的衍生特征,例如:车辆在服务区的“停留时长”、车辆行驶的“实际路径”与“最短路径”的比对、单位时间内的“通行频次”等,为Insight-Agent的模型分析提供更丰富的输入维度。

  时空标签注入:为每一条通行记录关联时间维度(如是否为节假日、高峰时段)和空间维度(如所属路段、行政区域),便于BI-Agent进行多维分析。

  实体关联构建:通过图数据库技术,挖掘车辆、ETC卡、车主之间的潜在关联,为识别团伙作案等复杂行为提供关键线索。

  2.3技术实现完整说明

  本项目的技术核心在于将通用大语言模型的强大认知推理能力与高速公路稽核业务的深度领域知识进行“范式级”融合。并非简单调用API,而是围绕精准性、可靠性、主动性三大目标,设计并实现了一套从数据处理、模型优化到任务执行的端到端技术链路。以下将分别详述三大核心智能体的技术实现路径。

  2.3.1 BI-Agent:让“小美”成为懂业务的数据分析专家

  【场景重现】

  省中心现场,用户下达语音指令:“从数据库中查询宿州管理中心6月份的缴费通行稽核情况。” 几秒后,“小美”不仅展示了对应的SQL查询语句,更直接给出了结论:“通过查询可知,宿州管理中心在2025年6月份的缴费通行稽核总金额为51556.88元。”,并自动生成了可视化图表。

  这一“化语言为洞察”的神奇能力,源自“小美”的决策支持BI智能体(BI-Agent)。它让管理者彻底摆脱固定报表和复杂BI工具的束缚,实现真正的“对话式数据分析”。核心技术栈包括增强型Text-to-SQL、领域知识图谱、指令微调(Instruction Fine-tuning)、智能可视化。其技术实现路径如下:

  第一步:深度语义理解 —— “小美”如何听懂“人话”

  当“小美”听到“给我看看2025年2月全省稽核堵漏增收数据,并按运营公司进行对比”,BI-Agent并非进行简单的关键词匹配。而是训练了一个轻量级的意图识别模型,它能深度解析查询,将其分解为结构化的意图单元:

  查询意图(Intent): ANALYZE_REVENUE_INCREASE

  核心指标(Metrics): 稽核堵漏增收

  时间范围(Time Range): 2025-02-01 to 2025-02-28

  分组维度(Group By): 运营公司

  附加指令(Action): 对比(COMPARE)

  第二步:领域知识图谱Schema映射(创新点)—— “小美”的“业务导航地图”

  传统Text-to-SQL的最大挑战在于模型无法理解“堵漏增收”这类业务术语与数据库字段的复杂关系。“小美”构建了稽核领域知识图谱。这相当于一张内置的“导航地图”,当“小美”听到一个业务术语时,能立刻通过地图查到它在数据库中的确切位置,为生成精准SQL打下基础。

  此图谱作为“语义中间件”,将业务概念与物理数据模型连接起来:

  节点(Nodes): 业务概念(如“假冒绿通”)、数据库表(t_case)、字段(evasion_type)。

  边(Edges): 定义了它们之间的关系。例如,“假冒绿通” -> 映射为(maps_to) -> t_case.evasion_type = 'FAKE_GREEN'。 当模型遇到业务术语时,会先查询知识图谱,获得其在数据库中的确切定义,从而为后续生成精准SQL打下坚实基础。

  第三步:高质量SFT微调 —— 教“小美”写出“专家级”SQL

  从稽核业务平台积累的真实报表和分析需求中,人工标注了超过5000对高质量的“自然语言-复杂SQL”数据对。这些数据覆盖了多表连接、窗口函数、子查询、CASE WHEN等典型稽核分析场景。利用这批数据,对基座大模型(如Qwen Coder)进行了指令微调。这使得“小美”不仅能生成语法正确的SQL,更能写出符合稽核业务逻辑的高性能SQL,最终SQL的可用性和准确率达到97%以上。

  第四步:自愈执行与智能可视化 —— “小美”如何确保结果并优化呈现

  生成的SQL并非直接执行。系统会先进行一次“预执行”校验,检查语法错误。如果执行失败,LLM会结合错误信息进行一次自动修复(Self-Correction)。执行成功后,系统会根据用户的初始意图(如COMPARE、TREND),自动调用ECharts等可视化库,选择最合适的图表(柱状图、折线图、热力图等)进行渲染,并由LLM生成一段摘要性文字结论,形成“图表+文字”的完整洞察报告。

  2.3.2 Expert-Agent:为“小美”注入权威可靠的“知识大脑”

  【场景重现】

  高速收费站绿通一线,用户直接提问:“甲鱼属于绿通吗?” “小美”迅速且肯定地回答:“甲鱼不属于鲜活农产品,不能享受绿色通道免费政策”,并清晰地引用了相关法规作为依据。

  这种响应快速、答案精准、来源可溯的专家级表现,来自于“小美”的一线业务专家智能体(Expert-Agent)。它是一个权威可靠的“知识大脑”,彻底解决了一线人员面对复杂政策的查询难题。其技术实现路径如下:

  第一步:结构化知识库构建 —— “小美”的“精读”与“记忆”

  高质量的知识库是RAG成功的基础。摒弃了简单的文本切割,采用智能文档处理(IDP)技术,让“小美”能像人一样“精读”上百份政策文件,完整理解其章节、表格等结构。再通过“语义块”策略,确保她“记忆”的每个知识片段上下文完整。对超过500份的PDF、Word文档进行解析,完整保留其标题、段落、表格、列表等结构化信息。采用“语义块(Semantic Chunking)”策略,以语义的完整性为边界进行切分,确保每个知识片段上下文完整,避免了答案被割裂的问题。

  第二步:混合检索(创新点)—— “小美”的“联想”与“精通”能力

  如何让“小美”既能听懂“J2类客车”这种专业术语,又能理解“私家车带拖挂怎么收费”这种口语化问题?通过设计混合检索引擎,让她兼具“关键词精确匹配”和“语义模糊联想”两种能力,确保全面而精准地理解用户意图。设计并行混合检索引擎:稀疏向量检索 (Sparse, a.k.a. 关键词检索): 使用BM25算法,精准匹配缩略语、政策编号等关键词。稠密向量检索 (Dense, a.k.a. 语义检索): 使用业界领先的BGE-M3E等中文Embedding模型,将知识块和用户问题向量化,存储于Milvus向量数据库,实现基于语义相似度的模糊匹配。 两路召回的结果会被合并,确保既不会漏掉精确匹配,也能理解用户的真实意图。

  第三步:Cross-Encoder精排模型 —— 为“小美”筛选出“最佳答案”

  初步召回的几十个知识片段可能存在干扰项。为确保提供给LLM的上下文质量最高,引入了重排序(Re-ranking)环节。将召回的Top-K结果对输入一个更强大的跨编码器(Cross-encoder)模型。该模型会同时处理“用户问题”和“知识片段”,进行深度的语义交互打分,从而将最相关的一两个片段以极高的精度排到最前面。这一步是答案准确率能达到98%以上的关键。

  第四步:带精准溯源的可控文本生成 —— 让“小美”的每个回答都“有据可查”

  将最优知识片段喂给“小美”,并通过一个精心设计的指令模板,要求她必须像一名严谨的专家那样作答,并清晰列出引用的法规来源。

  Prompt 示例:“你是一位严谨的安徽高速稽核政策专家。请根据以下[参考资料]...在回答结束时,必须严格按照[来源:文件名-章节号]的格式,清晰地列出所有引用的资料来源。”

  这种机制,从根本上保证了“小美”回答的权威性与可靠性,使其成为一线人员最值得信赖的助手。

  2.3.3 Insight-Agent:将“小美”进化为具备“专家直觉”的分析大脑

  【场景重现】

  视频中,用户提出一个开放性问题:“皖KZ8501有没有逃费?” “小美”并非简单查询记录,而是进行了一系列深度分析,最终输出了一份包含通行路径、里程、嫌疑金额和嫌疑类型的完整“微型案卷报告”。

  这种超越简单数据查询,模拟高级稽查分析师进行主动研判的能力,正是“小美”最核心的智能体现,由其主动稽核洞察智能体(Insight-Agent)提供。它的目标是模拟专家的思维模式,主动发现未知、复杂、团伙性的新型逃费行为。其技术实现路径如下:

  第一步:多模态融合 —— 构建‘小美’眼中的车辆全息画像

  为每辆车构建了动态的、多模态的“车辆画像”。当需要分析一辆车时,系统会秒级聚合其所有数据:

  通行数据: 从关系型数据库获取其历史通行记录。

  图像数据: 调用基于OCR的车牌/车型识别模型识别沿途门架抓拍图片中的车牌、车型标识,并与记录交叉验证;调用YOLOv8等图像分类模型判断车辆的物理外观(如货车车厢形态),判断是否存在“大车小标”嫌疑。

  案卷数据: 检查该车是否为稽核“黑名单”或有历史案底。 所有异构信息最后由LLM进行“解读”和“摘要”,生成一份人类易于理解的结构化画像报告。

  第二步:人机共建的“逃费行为模式库”

  结合专家经验和机器学习能力,构建一个持续进化的混合模式库:

  专家规则层: 将明确的稽核规则(如“入口轴型突变”、“同站进出超时”)沉淀为高效的SQL查询或规则引擎脚本,每日定时扫描。

  机器学习层: 部署多种无监督/半监督算法。例如,使用DBSCAN聚类算法分析车辆的通行时间、空间、频率特征,能够有效发现行动轨迹高度相似的“团伙作案”车辆;使用时序异常检测算法发现“行驶路径链条断裂”等单靠规则难以覆盖的异常。

  第三步:LLM作为“认知核心”的主动分析(核心创新)—— “小美”的“思考过程”揭秘

  Insight-Agent最大的创新,在于将大模型定位为“小美”进行分析推理的“认知大脑”,而非简单的任务执行工具。当底层算法发现异常信号时,工作流如下:

  信号发现:算法发现“皖A1, 皖A2, 皖A3”三辆车行动高度关联。

  数据萃取:“小美”自动调取这3辆车的全息画像和相关数据。

  假设生成与推理:“小美”的“认知大脑”(LLM)开始工作,它会根据如下的“内心思考指令”进行深度分析:

  Prompt 示例(“小美”的内心思考指令):

  Prompt 示例(“小美”的内心思考指令):“你是一名拥有10年经验的顶尖稽核分析师。以下是3辆被算法识别为行动高度关联的嫌疑车辆数据。请:1. 深入分析它们的通行记录... 2. 基于你的经验,推断它们可能采用的集体逃费手法... 3. 评估此线索的风险等级... 4. 生成一份简明扼要的分析报告,并给出下一步核查建议。”

  通过这种“机器发现信号 → AI进行认知推理”的新范式,“小美”得以突破固定规则的局限,真正像人类专家一样去“思考”,发现前所未见的复杂逃费模式,实现稽核能力从“自动化”到“智能化”的质的飞跃。

  3、取得成效

  在决策效率方面,管理层获取关键数据的时间从小时级缩短到分钟级。原需3名分析师耗时2至3天的月度分析报告,现可在1小时内完成,且支持会议现场即时查询分析,决策时效性和科学性大幅提升。

  在一线减负方面,政策查询响应时间从5-10分钟缩短至30秒内,准确率从85%提升至98%以上。每个收费站日均节省2-3小时查询时间,全省2000余名一线人员工作效率提升40%以上,有效减少因咨询答复和特情处理等佐证依据不足导致的业务争议。

  在稽核能力方面,每月可发现500-800条高价值稽核线索,挽回损失200万元以上。对跨省协同、技术性逃费等新型违法行为识别能力大幅提升,有效震慑违法行为。

  在应用前景方面,具备推广价值和示范效应。本应用为大模型在稽核领域的创新应用,具备良好的可复制性:从横向拓展看,核心技术架构可快速复制到其他省份。全国高速联网收费技术标准统一,只需根据各省政策规则适配调整即可部署。从纵向延伸看,智能体框架可拓展至客服投诉处理、路网态势分析、养护决策、应急调度等场景,未来将构建覆盖高速公路全业务链的智能体生态。 从技术迭代看,将持续跟踪大模型技术前沿,及时引入先进模型算法,通过数据积累和模型训练不断提升系统智能化水平。

  本项目不仅能有效提升安徽省高速公路稽核工作的质量和效率,更将为全国高速公路智能化升级提供可复制的成功经验,为建设交通强国贡献科技力量。

关于我们 | 联系我们 | 广告合作 | 版权声明 | 人员查询 | 我要投稿 | 招聘信息 | 我要投诉

人民交通24小时值班手机:17801261553 商务合作:010-67683008转602 E-mail:zzs@rmjtzz.com

Copyright 人民交通杂志 All Rights Reserved 版权所有 复制必究 百度统计 地址:北京市丰台区南三环东路6号A座四层

增值电信业务经营许可证号:京B2-20201704 本刊法律顾问:北京安济律师事务所主任 李宝柱

京公网安备 11010602130064号 京ICP备18014261号-2  广播电视节目制作经营许可证:(京)字第16597号