2024 年 8 月 21 日消息,天眼查知识产权信息显示,智慧芽信息科技(苏州)有限公司申请一项名为“文本识别方法和装置、计算机可读存储介质和电子设备“,公开号 CN202310113599.9,申请日期为 2023 年 2 月。
专利摘要显示,本申请涉及文本处理技术领域,具体涉及一种文本识别方法和装置,以及计算机可读存储介质和电子设备,解决了传统的功效文本识别方法对功效文本的提取效果差的问题。该文本识别方法包括:利用文本分类模型,对待识别文本进行分类,确定待识别文本中的第一功效文本集合,第一功效文本集合包括 M 个第一功效文本;基于待识别文本与预设功效文本集合进行相似度计算,并利用相似度计算的结果确定待识别文本中的第二功效文本集合,预设功效文本集合包括至少一个功效文本,第二功效文本集合包括 N 个第二功效文本;基于第一功效文本集合和第二功效文本集合,确定第一文本识别集合,第一文本识别集合包括第一功效文本集合和第二功效文本集合。