2024年10月24日,在第十二届汽车与环境创新论坛上,上海知从科技有限公司商业开发总监曹守营表示,不符合时代的产品正在被时代所抛弃。当前汽车产业正处于百年未有之大变局,并呈现出从“软件定义汽车”向“AI定义汽车”的转变。
作为专业从事汽车电子基础软件产品开发和相关技术服务的汽车软件公司,知从科技自成立之日起,就坚持基础软件,工具软件,功能安全,信息安全,FOTA 五条主要产品线,并提供相应的工程服务。曹守营指出,在汽车领域,我们正在不断用大模型赋能汽车发展。
聚焦“知从大模型”的技术框架,曹守营具体分享了如何用大模型赋能汽车基础软件发展。并围绕需求管理机器人、软件开发机器人、软件测试机器人、项目管理机器人进项了详细介绍与方法论的介绍。
曹守营 | 上海知从科技有限公司 商业开发总监
以下为演讲内容整理:
AGI与汽车行业的变革
首先,AGI作为新兴的生产力,在竞争日趋激烈的当下,企业若要持续发展,采纳AGI及大模型已成为必由之路。探究AGI的必要性,我们可以从手机行业的变革中窥见一斑。从诺基亚的直板手机,到配备键盘的智能手机,再到如今普及的触屏手机,不过短短十几年间,智能手机已发生了翻天覆地的变化。那些未能跟上时代步伐的产品,早已被市场淘汰,汽车行业亦面临着相似的变革。
以往,开发一款新车需耗时五六年,而今三年已足。众多OEM厂商每年都在发布新车型,未来这一周期甚至可能缩短至半年乃至三个月。我们曾热议“软件定义汽车”,而今,“AI定义汽车”已成为新的潮流。汽车行业的这一趋势也极大地影响了汽车基础软件的发展。以往提及汽车基础软件,人们首先想到的是AUTOSAR,而今,也要包括功能安全、信息安全和FOTA。
我们知从公司是全球唯一一家能提供全栈车控基础软件解决方案的企业,我们的软件不仅涵盖了基础软件、功能安全、信息安全,FOTA,还包括多款上位机工具,以及为此配套的工程服务。
再来看汽车基础软件架构的变迁。随着SOC芯片的应用,我们引入了安卓、QNX等操作系统及其对应的生态软件。同时,AUTOSAR也发布了Adaptive AUTOSAR规范。这一切都给汽车基础软件的开发带来了前所未有的挑战。观察AUTOSAR规范文档的变化,我们不难发现,页码越来越多,内容也越来越丰富。和基础软件密切相关的还有芯片手册。以往,一个MCU的世界规范可能只需500页手册来描述,而今却需要上万页,内容量增长了20倍。
图源:知从科技
类似地,和汽车行业相关的,还有整车规范,功能安全规范,信息安全规范,汽车软件开发流程规范等等。总之,规范在增加,规范的内容也在增加。面对这一挑战,增加人手或许是我们首先想到的解决方案。我们需要更多的人来帮我们写代码,更多的人帮我们读文档,更多的人帮我们服务客户。而这,正是我们设计大模型所期望达到的目的和效果。
AGI及大模型在汽车软件开发中的应用
在汽车基础软件的开发过程中,我们遇到了诸多难题。然而,AGI的发展却呈现出百花齐放的态势。自2022年底ChatGPT 3.5发布以来,大模型的发展速度日益加快。无论国内还是国外,几乎每天都有新的大模型问世,参数量也在持续增长,从最初的200亿增加到了现在的5620亿。大模型参数的增加意味着自学习能力的提升,准确性的提高,以及应用范围的拓宽。我们看到了文本创作、问答、聊天、翻译、代码生成等多样化的应用场景。
图源:知从科技
随着多模态大模型的应用,文生图、文生视频等功能也愈发普及。在汽车领域,大模型的应用同样广泛。以智能驾驶和智能座舱为例,每个OEM厂商都有自己的解决方案,而具身智能更是引起了业界的广泛关注。
下面开始介绍一下我们知从大模型的框架。在框架的底层,我们使用了一些通用的大模型作为开发基础,如百川,ChatGPT,LLaMA3等。我们自己是没有大模型开发经验的,所以我们和头部企业合作,借鉴于他们成熟的经验来为我们服务。在基础模型之上,我们搭建了低代码智能体平台,主要集成了其他第三方的大模型应用,如向量大模型、向量数据库以及LangChain开发框架、LangSmith监控资源使用情况的应用等。还有GraphRAG,这是一种采用知识图谱的方式表达实体及其之间的关系,通过图搜索的方式从数据库中检索知识,相比传统的向量化方法更为准确。这是我们未来关注的重点方向。此外,我们还引入了第三方的应用,如实时搜索、文生图等。
在智能平台之上,我们构建了智能体。智能体的底层是知识库,我们根据项目角色对知识进行了分类处理,搭建了不同的知识库。这些知识库是通过行业知识和项目经验训练而成的,相互独立但又通过智能体相互关联。
知识库之上是智能体,我简要介绍一下智能体的工作原理。对于传统知识库中的问题,问答机器人可以直接从知识库中寻找答案进行回答。然而,对于更复杂的问题,如“今天的气温比昨天高了几度”,知识库中没有现成的答案,所以问答机器人是回答不出来的。这时,智能体就会将问题分解为多个步骤,分别获取今天和昨天的气温,然后进行计算得出答案。对于获取指定日期的气温,知识库中也没有现成的答案,可以借助于第三方的应用来实现。如上所述,智能体具有任务分解,自我迭代,以及调用第三方应用的特性。
基于这样的特性,我们构建了多个不同的智能体来完成不同的应用任务。智能体之上就是我们的机器人,它们能够解决我们之前提到的缺少人手编写代码、阅读文档、服务客户等问题。
关于知识库的构建,大家可能会疑惑为什么我们不将所有知识存放在同一个知识库中,而是分成多个知识库进行存储。这是有原因的,我们将知识上传后进行文档解析、切片处理,然后利用向量化大模型对其进行向量化处理,将结果存储在向量数据库中。当用户提出问题时,我们会对问题进行向量化处理,然后在向量数据库中检索相似的知识。这个检索过程是利用向量相似性进行检索的,会找出最接近的一些知识交给大模型进行推理和总结,最后反馈给用户。
但实际上,大家在构建知识库的过程中,会遇到各种挑战,尤其是在最终实施阶段。例如,向量大模型的选型,采用不同的向量大模型,所得到的的答案会有差异;而向量数据库的不同,也会影响检索的效率、效果及内容。此外,文档切片的方式、大小、重合度等因素,都会对最终结果产生影响。再者,文档解析同样重要,对于普通文本,解析方法大同小异;但对于图片、图表等结构化数据,处理方法则因方法不同而效果各异,这里涉及到结构化文本泛化的问题,处理方案比较复杂。
基于我们行业的知识和项目经验,我们对知识库进行了分类处理,并放在不同的知识库中进行细化。使用不同的向量大模型,配置不同的参数,目前取得的效果还算不错,召回率稳定在85%左右,后续我们将进一步优化。
解决知识库问题后,我们再来看机器人的搭建及其使用场景。以需求管理机器人开始,它协助系统工程师进行需求管理,能够通过需求分析智能体从客户的文档(如OEM规范,芯片手册等)提取需求描述,甚至分析需求实现方法、验证方法及潜在风险等信息。同时,它还能建立需求之间的交互关联性,以便在需求变更时确定最小影响范围。此外,需求管理机器人在管理需求的同时,还需要建立质量管理需求描述文档,因为质量管理是贯穿于软件开发全生命周期的。
再来看软件开发机器人,它协助软件开发,大模型在文档处理和代码开发方面均表现出色。然而,由于软件开发的特殊性,仍需较多人工介入,如架构设计文档、软件设计描述文档等。特别是软件设计需明确定义函数接口、参数配置及函数间的调用关系。单元代码Agent可根据这些描述文档生成单元代码,并同时生成功能验证代码及异常处理代码。随后,软件测试机器人会结合持续集成工程进行测试,生成相应的测试报告。
值得注意的是,AGI编写的代码并非无懈可击,反而可能存在低级错误。但AGI具有自我迭代能力,可根据错误原因进行自我改进。我们前面已经使用软件测试机器人进行了单元代码的测试。由于测试用例设计是有方法论的,测试用例Agent可以利用这些方法论,设计测试用例项,并创建出测试项的前置条件、测试步骤及预期结果。测试代码Agent可以据此编写测试代码,测试Agent则对测试代码进行测试,生成相应的测试报告。
此外,还有项目管理机器人,它协助进行项目管理,应对需求变更导致的项目计划和人员调整。项目监督Agent可根据缺陷输入动态调整项目状态,而风险管理Agent可以根据触发的风险项,进行风险分析,并结合历史经验提出合理化建议。问答机器人则负责与客户交互,根据用户输入判定目的,并通过问题分类器将其交由不同知识库解答,这也体现了智能工作流的应用。
我们将机器人应用于实际项目中,选取规模相近的项目进行验证。在保持项目质量的前提下,我们成功将原本25周的工时缩短至10周,即节省了60%的成本,效果显著。特别是在单元代码开发和单元测试方面,效果尤为突出,与大模型适用于自动化测试和软件开发的特点相契合。
尽管我们已经取得了一定的成果,但对结果并不完全满意,因为我们还有很多工作需要继续优化。接下来,我们计划从两个方向进行优化:一是优化知识库,采用知识图谱方式构建,并引入图数据库等技术;二是提升Agent的智能化水平,减少人工参与,同时开发更多Agent。此外,我们还将尝试多智能体协同工作,以实现智能体间的相互监督、审批和协作。虽然难度颇大,但意义非凡,一旦成功,将极大降低人工依赖。
公司介绍与产品展示
上海知从科技有限公司,致力于通过产品和服务提升汽车电子控制器的开发质量和速度,降低客户成本,增强产品的可维护性。我们的愿景是成为全球领先的汽车基础软件公司,专注于汽车基础软件领域。我们非常注重用中国传统文化打造我们的企业文化,我们公司的名字就来自易经中的一句话,“易则易知,简则易从”,取了每句话后面的字,我们的slogan“知从科技,易知简从”也来自这里,隐含着我们要将我们的产品做到简单明了,让客户容易使用。
同时,“知”这个字也蕴含了“知了”的含义,因此我们的标志设计选用了蝉的形象,蝉也隐含着BUG的意思,隐含着我们的期望,我们的产品中不要有BUG。接下来介绍我们的开发流程,我们遵循严格的标准进行软件开发,通过众多项目的实践,我们在软件开发、文档管理以及质量管理领域积累了深厚的经验,已经通过了ASPICE Level 3的流程认证,我们的功能安全库也已经通过了ASIL D的产品认证。
以下展示的是我们公司的三大核心产品,其命名灵感源自中国传统的十二生肖,这样的命名策略赋予了产品高度的识别性。木牛产品里面包括木牛基础软件平台,包含Autosar中的各个模块;木牛功能安全库,这是用软件实现芯片的安全机制,避免因为芯片错误导致汽车风险;木牛信息安全库,主要实现了HSM里面的固件,还有其他Autosar中和加解密相关的模块;MCAL,这是微处理器抽象层,我们提供MCAL的开发,定制,以及配置集成服务。
图源:知从科技
青龙产品,包括Bootloader系列, 也包含了SecureBoot和FOTA产品。另外我们还有玄武上位机软件,可以提供刷写,诊断和测试功能。木牛上位机配置工具,配合木牛基础软件平台使用,可以对Autosar各个模块进行配置生成。回顾产品发展历程,我们每年持续迭代升级,这一过程中积累的项目经验,有力地证明了产品的稳定性与可靠性。
最后,关于公司的资质荣誉,我们是经认证的高新技术企业,同时也是上海地区“专精特新”企业代表,并且是包括AUTOSAR在内的多个行业联盟的成员单位。
(以上内容来自上海知从科技有限公司商业开发总监曹守营于2024年10月24日在第十二届汽车与环境创新论坛发表的《拥抱大模型时代,AGI赋能汽车基础软件》主题演讲。)