专利、论文等文献是技术的重要载体,也是企业研发创新的重要情报信息源之一。如何在海量技术文献中快速筛选出有价值的技术关键信息,并将其转化为创新灵感,成为了当下亟待解决的研发创新难题之一。
为此,科技创新信息服务商智慧芽基于NLP、机器学习、计算机视觉等强大的AI技术能力,发布自研“Tech DNA”技术,让研发人员更便捷地检索、阅读、分析技术文档。该技术实现了从海量技术文档中识别抽取技术问题、技术手段、技术实施、技术效果、技术应用等“技术DNA”信息,对其进行结构化拆解,进而重构技术文档,还原技术本身。
智慧芽副总裁屠昶旸表示:“在智慧芽服务研发创新的十几年中,我们发现IP人员与研发人员对同一篇专利文献的关注点不尽相同。而且,技术关键信息往往湮没在长篇累牍的专利文献中,对研发人员获取关键信息产生了极大的阻碍。我们坚信,Tech DNA能为研发创新场景显著提升效率,为企业等创新主体带来巨大的价值。”
Tech DNA破解技术文献密码,为研发创新而生
正如“生物DNA”携带遗传信息,是生命之根本,智慧芽相信在以专利为代表的技术文档中,同样存在记录技术之根本的“技术DNA”信息,如技术问题、技术手段、技术实施、技术效果、技术应用等。
图:Tech DNA识别提取技术关键信息示意图(来源:智慧芽)
在“Tech DNA”体系中,既有针对专利文本的Patent DNA,也有针对论文文献的Paper DNA。智慧芽还针对专利文本中的特征属性,通过AI技术识别抽取其中的PUM信息,即属性(Property)、单位(Unit)、数值范围(Measurement)——如热导率300W/k/m,厚度2mm等——进行标准化归类,以提升技术信息检索的效率,特别在新材料领域的技术分析场景中应用广泛。
图:智慧芽Tech DNA数据处理示意图(来源:智慧芽)
专利文献由于其天然的法律属性,很多人可能忽略了它其实也是记录某一项技术的载体,忽略了专利所承载的技术价值。Tech DNA的出发点是帮助研发人员从融合了法言法语和技术专业术语的专利文献中找到技术相关的核心信息,这与智慧芽研发情报库的初心一致,目前也主要应用于该款产品。那些研发情报库中让研发人员眼前一亮的功能,如AI智能标题、AI技术摘要、技术效果筛选、特征属性过滤等贴合研发场景的功能背后,都有着Tech DNA的加持。
此外,智慧芽专利数据库中目前也有一些功能采用了Tech DNA技术,如在搜索结果过滤栏和自定义分析视图中的“技术功效短语”功能,同样能够帮助IP人员在大量专利中精准定位和精细分析。
大幅提升研发人员检索、阅读、分析技术文献效率
Tech DNA是业内鲜有的专为研发创新场景研发的技术能力。基于该技术,智慧芽给研发人员带来了全新的搜索、阅读、分析技术文献的方式,极大地简化了研发人员找技术和分析技术的体验,让他们更加专注于技术本身。
以往,研发人员若想找到某一具体的技术方案,常常需要学习专利数据库等产品的检索语法,构建一套复杂的检索式来框定范围,再根据自己的专业知识与IP知识,逐篇寻找自己想要的技术方案。阅读和分析这类未经Tech DNA处理的原始文档,往往需要花费十几倍的时间,甚至更多。
现在,收录在智慧芽研发情报库中的技术文献都经由Tech DNA进行了解构与重构,因此,研发人员只需用自然语言的方式,输入一句话或几个词,系统就能“理解”该技术问题,并推送给他相应的结果。与此同时,研发情报库将该技术解决的问题、使用的手段方法、达到的有益效果、相关的实验方案/对比方案/效果测试、特征属性等研发人员最为关注的内容识别提取出来,在版面上直观呈现,方便研发人员快速阅读理解,把握技术核心。
图:AI智能标题、AI技术摘要功能(来源:智慧芽研发情报库)
Tech DNA技术本身拥有多项独家技术,智慧芽已申请相关专利。未来,智慧芽将为更多垂直领域的场景升级迭代Tech DNA技术,定制组合或开发更多功能,满足新材料、新能源汽车、芯片通信、科技金融等领域从业者对科技创新信息的使用需求,进一步扩大Tech DNA的底座能力,为科技创新赋能。