十大科技前沿发明发布，百度王海峰：鼓励培养AI原生思维

2023-09-21 12:22:12 0 0

2023年9月12日，以“专利协同前沿创新，共建人工智能本土未来”为主题的“2023百度十大科技前沿发明”新闻发布会在北京召开。十大前沿发明中，70%以上涉及大模型和重建创新。一批创新的人工智能本土应用积极推出，大量高价值专利成果披露。百度首席技术官（CTO）百度集团资深副总裁、总法律顾问梁志祥王海峰致辞，北京市知识产权局副局长秦元明出席仪式并致辞。

百度首席技术官王海峰表示，大型语言模型具有理解、生成、逻辑、记忆等人工智能的核心基本能力，为一般人工智能带来曙光。文信大语言模型是百度多年的技术积累和产业实践。飞桨深度学习平台与文信大模型的联合优化，为文信提供了坚实的基础。“我们大型模型的专利申请和授权在中国排名第一，深度学习的专利申请在世界上排名第一。今天发布的十大科技前沿发明是百度过去一年前沿创新成果的集中展示。超过70%的发明涉及大型模型和重建创新。我们鼓励人工智能原创思维的培养，积极创新人工智能原创应用。”

北京市知识产权局副局长秦元明提到，中国以科技自力更生为国家发展的战略支撑，以科技创新为引领发展的第一动力，深入实施创新驱动发展战略，开启了建设世界科技强国的新征程。在这个新征程中，百度等科技企业一定会有很大的进步；十大科技前沿发明展示了百度在许多世界前沿领域的创新和突破，必将引领行业高水平创新和高质量发展。

目前，数字经济与实体产业融合发展加快。我国产业体系种类齐全，规模庞大，人工智能技术应用场景丰富，使产业转型升级得以实现，广泛应用于各行各业，成为科技革命和产业变革的重要驱动力。百度继续推进人工智能技术的大规模实施，坚持加强开放合作中的自主创新，推动产业高质量发展。

百度集团高级副总裁兼总法律顾问梁志祥表示，技术竞争的背后是知识产权竞争。强大的公司背后有一个强大的技术团队，强大的技术团队背后有许多强大的专利。百度拥有强大的技术团队和充满技术基因的知识产权团队。大型技术和专利布局在行业中处于领先地位，为百度产品的领先地位提供了重要的支持。“世界正在发生变化，世界正在不断创新，现在是各种技术人员的时候了。”梁志祥叹了口气。

百度专利部崔玲玲发布了“2023年百度十大科技前沿发明”。十大发明反映了百度许多国际前沿核心技术的实现和突破，充分证实了百度在促进前沿创新和产业升级方面的强大实力，展示了百度技术的前沿和市场前瞻性。十大技术前沿发明包括大型模型、端到端搜索、桨、人工智能芯片、生成检索、内容生成推荐技术、自动驾驶决策系统、生物计算大型模型和高性能量子芯片。

随着越来越多的大型模型产品的推出，我国生成人工智能的发展也将从“大型模型参数”阶段进入“原始应用和工业登陆”阶段，产品和应用的每一个功能的正常运行都离不开大量的前沿发明作为底层技术的支撑。这些前沿发明构建了一般人工智能的四大核心能力：理解、生成、逻辑和记忆，推动了大型模型能力在各行各业的应用。

8月31日，文欣率先向全社会全面开放，受到市场的热烈反响。开放第一天，他回答了3342万名网民的问题。10月17日，“生成未来”（PROMPTTHEWORLD）以“为主题的BaiduWorld2023将在北京举行。百度作为年度最重要的战略、技术和产品新闻发布会，将发布多个人工智能本地应用程序，介绍大型模型的核心能力和最新进展。百度还将通过持续的研发投资和技术创新，促进数字智能产业的快速发展，与合作伙伴一起推动人工智能产业化，实现高水平的技术自力更生，为高质量的经济增长带来更多的动力。

百度2023十大科技前沿发明如下：

首先，基于大型检索生成决策交互的智能系统

本发明提出了知识增强的大型智能交互系统。本发明通过知识内化和知识外用两种方式提高模型的知识和推理能力，通过搜索提高模型的有效性和事实准确性，通过对话提高模型的记忆能力和多轮交互能力。该发明技术显著提高了对大型模型的理解、生成、逻辑和记忆能力，并广泛应用于百度的核心业务，使各行各业成为可能。

2、基于大模型的端到端搜索技术

该发明提出了大型端到端搜索技术，打破了传统的级联分治模式，标志着百度搜索技术架构10多年来的重大代际变化。该发明技术已广泛应用于通用搜索、视频搜索、企业搜索等场景，系统效果和研发效率显著提高。

三、端到端自适应的分布式训练技术

本发明通过“两个统一表示”对硬件资源和模型结构进行统一建模，支持任何模型在异构硬件下实现最佳模型分割和资源分配，实现通用自动混合并行策略的高效培训，并根据故障中断和资源扩展自适应重新完成最佳分割和并行策略选择，实现自动容错和灵活调度，在大规模分布式培训的灵活性、易用性、高效性和鲁棒性方面具有明显优势。该发明技术的成功有助于文欣的高效培训。大规模集群作业培训的效率提高了30%以上，在百度智能云、智能搜索推荐等核心产品线中发挥了重要作用，也广泛应用于传统产业的智能化转型，产生了显著的经济效益和社会效益。

四、飞桨多硬件分层适合一体化技术

针对智能芯片的多样性，通过松耦合的分层设计和简单的适配接口，可以显著降低芯片和框架适配的复杂性，广泛兼容各种硬件类型。支持软硬系统优化，充分发挥硬件潜力，最大化AI应用的高性能需求，实现业务应用收益最大化。基于这项发明技术，飞桨已经完成了与40多家芯片/IP制造商的高效适配，实现了AI软硬件生态的繁荣，构建了AI软硬件适配技术体系，推动了国家标准，引领了行业发展。

5.企业级大模型平台AI芯片优化技术

本发明提出了面向企业级大模型平台的人工智能芯片优化技术，通过精确控制和提前预测，减缓了人工智能芯片的瞬时大电流，同时满足了高性能和低延迟人工智能计算。该技术可以有效地降低系统的整体成本，提高系统的稳定性和可靠性，并提高人工智能处理器在各种场景中的使用效率。该发明技术为百度智能云千帆等企业级大模型平台提供了更高效、稳定的培训和推理能力支持。目前，国内外主流大模型数量达到42个，提供了一整套大模型开发应用工具链，为企业构建高效可靠的人工智能应用。

六、全链生成智能检索系统

该发明首次将搜索系统与大规模生成技术相结合。通过引入整个链路的可信度改进策略、真实数据的增强培训和严格的模型风险控制机制，采用人工智能原始架构设计，完成异步模型计算架构的深度优化，成功突破了大型用户应用场景中大型模型的各种挑战。该发明技术实施了百度搜索产品，进一步提高了搜索结果的准确性和可靠性，帮助搜索第一个极端满意度快速提高，超越了国际同行。

七、基于用户心理理解的内容生成推荐技术

本发明构建了一个新的对话推荐系统，利用大模型理解能力和生成能力的优势:(1)将隐式反馈转化为自然语言交互，推荐系统可以对话，更方便用户理解；(2)实现内容推荐与内容生成的结合，整合推荐前的亮点、推荐中的互动、推荐后的延伸，提升用户的陪伴消费体验；(3)基于大模型能力生成的大量优质资源，支持个性化生成千人千面的内容。该发明技术已应用于百度Feed在线，通过对话满足用户的深层需求，激发用户的阅读兴趣和探索效率，一期在线提高用户时间10%。

八、数据驱动的自动驾驶决策系统

本发明以深度学习技术为核心，推动自主驾驶决策系统由规则驱动向数据驱动转变，包括交互决策模型及其培训方法、基于人类驾驶员和自主驾驶的数据生产方法、基于闭环仿真的评价系统等。该发明技术已应用于萝卜快跑Robotaxi业务，吸收数亿帧道路交互场景数据，决策准确率达到99.5%，实现90%以上的在线规则替代，有效支持Robotaxi无人操作。

九、生物计算大模型融合了第一性原理

该发明整合了生物领域的数据和生物化学原理，构建了一个非常创新的生物计算模型，在化合物和蛋白质领域取得了重大技术突破，标志着百度在生物计算方向上的国际领先地位。该发明技术已广泛应用于小分子药物发现、多肽药物设计、抗体药物设计等场景，在精度和速度上超越了许多传统方法，帮助合作伙伴在多条管道上找到高价值的候选药物分子。

十、高性能量子芯片设计、流片及测控全栈技术

该发明旨在开发“设计、流片、测控”闭环中的核心技术，旨在开发具有行业核心竞争力的高性能量子芯片，为量子计算的实际应用提供基本支持。通过“端到端”的优化和与量子软件和量子应用的集成，高性能量子芯片的研发将为人工智能、材料科学、药物研发、金融技术等领域带来高潜力价值，促进量子计算的产业化。