分享
解密Google Cloud 全新 PaLM2及创新应用
输入“/”快速插入内容
解密Google Cloud 全新 PaLM2及创新应用
飞书用户1744
2023年8月20日创建
2551
2900
📸背景
因长期在大模型相关的部门工作,每天接收到很多和AI相关的信息,但小编意识到目前理解到的一些AI知识还有些片面。
恰逢稀土掘金开发者大会有谈到大模型相关的知识,于是借此机会,对大模型相关的一些知识再了解一波~
以下文章是对
大模型与AIGC分论坛
第一部分的整理与归纳。
一、💡大语言模型及PaLM2介绍
1、大语言模型可以做什么
下面先来说说,我们在用大语言模型可以干些什么。
(1)常见使用场景
•
娱乐
—— 游戏公司用大语言模型做
NPC
的输出,让
NPC
能够跟我们自然地对话。(NPC指的是
非玩家对话
)
•
工作助理
—— 帮我们执行任务,通过不同的方式去搜索、去计算,去执行一些业务的交易。
•
知识库
—— 可以作为一些自有的知识库,或者结合企业内部的知识库,去海量的知识中帮助我们
检索有用的信息
,帮助我们去更好地完成工作。
(2)LLM → LDM
我们说大语言模型是
LLM
,但实际上也可以说它是
LDM
,也就是让语言驱使大模型去完成我们一些实际上的任务。
比如:
①类似
siri
,用语言控制
AI
做事;②描述画图场景,让AI帮我们画出想要的图形。③……
(3)加快原型设计
除此之外,大语言模型可以极大得加快我们的工作速度,让我们的工作更集中于
创意和想法
,而不是琐碎的重复工作。比如说:我们在写一篇文章,里面有一块内容需要用到一张柱状图。
如果是
传统的方法
,我们需要去打开画图软件,一线一点的画出来。而如果把这个“画柱状图”的事情,交给
大语言模型
来处理,只需简单几句话,就让
LLM
帮我们把图画出来。这样,就能让我们把精力都专注于创意和想法,减少很大一部份的机械性工作和重复工作。
2、PaLM2的纸短情长
那么用什么工具来加快原型设计呢,这里就谈到了
PaLM2
。
(1)PaLM 2
•
LLM
——
PaLM 2
是
google
最新的通用大语言模型,全称为
Pathways Language Model
。
•
540-billion
—— 这意味着
PaLM2
模型是一个非常大的模型,具有
5400亿
的参数。参数的数量通常与模型的复杂性和能力成正比。更多的参数意味着模型可以学习和存储更多的信息,但同时也需要更多的数据和计算资源来训练。
•
稠密的纯解码器Transformer结构 ——
Transformer
是一种深度学习模型架构,广泛用于
自然语言处理任务
。"稠密的解码器"意味着
Transformer
架构中,解码器部分是
稠密连接的
,这有助于模型
更好地处理和生成文本
。
•
基于
Pathways
系统来训练 —— Pathways系统是
Google
用于训练其大型模型的新系统或框架,而
PaLM2
,就基于这个系统来进行训练。
(2)PaLM2对外商务场景
对外提供商务场景有4种不同的版本:
•
Gecko ——
壁虎模型
,只有
1B
的参数,它更多的是在移动设备上进行应用,比如在手机上做文本的生成。
•
Otter ——
水獭模型
,具有
8B
的参数。
•
Bison ——
野牛模型
,
Bison
是目前google对外商用的主流模型,具有
24B
的参数。目前
Google Cloud
以及
developer
,都是通过
Bison
,来提供
文本生成
、
对话交流
等任务。
•
Unicom ——
独角兽模型
,具有
340B
参数。像是一些专有领域的模型,比如下方第二张图:
Med-PaLM2
。它是医疗领域的一个知识问答库。像这样的专有领域的场景,就会使用最大的独角兽模型,来提供支持