
悟道大模型是由北京智源人工智能研究院发起的超大规模预训练模型研究项目,旨在以原始创新为基础实现预训练技术的突破,填补以中文为核心预训练大模型的空白,探索通向通用人工智能的实现路径。
悟道大模型包括语言、视觉、跨模态、跨语言等多个领域的大模型系列,如悟道·天鹰、悟道·视界、悟道·天鹰AquilaCode等。
悟道大模型不仅具备强大的语言理解和生成能力,还能进行逻辑推理、代码分析、图像生成等多种任务,支持多种类型的文本内容生成,如小说、歌词、诗歌、对联等。
悟道大模型还构建了开源大模型评测体系和生态,包括FlagEval(天秤)大模型语言评测体系及开放平台,以及FlagOpen(飞智)大模型技术开源体系,为大模型行业发展提供技术支持和服务。
悟道大模型的技术原理
悟道大模型是智源研究院开发的一系列人工智能模型,包括语言、视觉和多模态等领域。悟道大模型的技术原理主要基于 Transformer 模型,通过多层自注意力机制和前向神经网络,能够对输入的文本或图像进行编码,实现信息的提取、语义理解和生成回应。悟道大模型的训练过程包括两个阶段:预训练和微调。预训练是在海量的数据上训练一个通用的模型,微调是在特定的任务上对模型进行调整,提高模型的性能和适应性。悟道大模型还采用了一些创新的技术,如 MoE、Diffusion、OpenPrompt 等,来提升模型的规模、效率和能力。
悟道大模型的性能如何?
1、悟道·文汇是全球最大的万亿级人工智能大模型,它能够实现文生文、图生文以及图文生文等多项任务,超越了OpenAI GPT-3、DALL·E以及Google ALIGN等先进模型。
2、悟道·文澜是目前最大的中文通用图文预训练模型,它利用6.5亿对互联网图文数据进行自监督学习,能够在多个国际公开数据集上取得最佳性能。
3、悟道·视界是视觉大模型系列,它能够完成7种主流视觉任务,已经在深度估计、语义分割等核心视觉任务中性能“大幅超越同类”,相比同类模型具有11%~25%的性能提升,超过了图灵奖得主Geoffrey Hinton团队的Pix2Seqv2,艾伦AI研究所的视觉通用模型Unified-IO和谷歌的UViM。
4、悟道·八卦炉是超大规模深度学习训练系统,它能够支持万亿级参数模型的训练,性能超过1EFLOPS,并且能够训练174万亿个参数模型,这与人脑中的突触数量相当。
悟道大模型的发展历程
1、2020年10月,智源研究院发布了悟道1.0,我国首个超大规模智能模型系统,包括语言、视觉和多模态等领域的模型,总参数规模达到了2600亿,是当时国内最大的智能模型。
2、2021年6月,智源研究院联合多个外部实验室发布了悟道2.0,全球最大的万亿级人工智能大模型,包括语言模型GLM、文生图模型CogView等,总参数规模达到了1.75万亿,是OpenAI发布的GPT-3的10倍。
3、2023年6月,智源研究院发布并全面开源了悟道3.0系列模型,包括语言大模型悟道·天鹰(Aquila)、视觉大模型悟道·视界(EVA)以及一系列多模态模型,总参数规模达到了3.5万亿,是悟道2.0的2倍。悟道3.0系列模型是由智源研究院团队自研完成,采用了更高效的架构设计、更高质量的数据清洗、更创新的技术方法,实现了更优的模型性能和应用能力。
数据统计
相关导航

AnyText是阿里云开源的一种基于扩散的多语言视觉文本生成和编辑模型,它利用了深度学习、自然语言处理、计算机视觉等技术,实现了对图像中文本的检测、识别、生成和编辑。

MiracleVision奇想智能
美图推出的AI视觉大模型,支持AI图像、设计和视频创作

Lumiere
Lumiere是谷歌发布的一个文本到视频扩散模型,于2024年正式发布。这个模型能够直接生成全帧率、低分辨率视频,通过训练海量文本和视频数据,可以将文字描述直接转化为高质量、真实、多样且连贯动作的视频。适用于多种内容创作和视频编辑应用,如图像到视频、视频修复和风格化生成。

Yi大模型
Yi大模型是由李开复博士领导的AI公司“零一万物”发布的一款开源的中英双语预训练大模型。这个模型在多个性能指标上取得了国际最佳性能认可,被称为“全球最强开源模型”。Yi-34B模型特别之处在于它拥有全球最长的200K上下文窗口,能够处理40万汉字的超长文本输入,这在语言模型中是非常重要的,因为它对于理解和生成与特定上下文相关的文本至关重要。

YuE
YuE是由香港科技大学开发的开源音乐生成模型,专注于从给定的歌词生成完整的音乐音频。YuE 支持多种音乐风格和语言,能够生成高质量的声乐和伴奏部分,适用于各种音乐创作需求。通过 YuE,用户可以轻松生成长达 5 分钟的完整歌曲,实现创意音乐制作。

百度智能云客悦
百度智能云客悦是百度推出的智能客服平台。其旗下的智能外呼平台是一款集合NLP(自然语言处理)、ASR(自动语音识别)、TTS(语音合成)等人工智能技术,提供公有云服务并支持同时面向多名用户,自动发起外呼通话的智能化产品。

灵境矩阵
灵境矩阵是百度推出的一个基于文心大模型的智能体(Agent)平台。它支持开发者根据自己的行业领域和应用场景,选择不同的开发方式来构建产品,以适应大模型时代的需求。开发者可以通过低成本的prompt编排方式来开发智能体,同时平台还提供了流量分发路径,帮助开发者完成商业闭环。

百度智能云千帆
百度智能云是百度多年技术沉淀打造的智能云计算品牌,致力于为客户提供全球领先的人工智能、大数据和云计算服务。凭借先进的产品、技术和丰富的解决方案,全面赋能各行业,加速产业智能化。
暂无评论...