DeepMind指出「Transformer无法超出预训练数据实现泛化」,但有人投来质疑

人工智能 新闻
PromptIDE 的核心是代码编辑器 + Python SDK,其中 SDK 提供了一种新的编程范式,可以实现复杂的 prompting 技术。

距离马斯克的 xAI 公布 Grok 才过去一天,刚刚,xAI 又公布了另一款 AI 产品,一个可用于 prompt 工程和可解释性研究的集成开发环境:PromptIDE。

接连不断的新品发布,也让网友纷纷感叹:「xAI 团队的开发速度简直是疯了!」

xAI 在官方博客中这样介绍:PromptIDE 是一个用于 prompt 工程和可解释性研究的集成开发环境。它通过 SDK 加速 prompt 工程,并且该 SDK 可以完成复杂的 prompt 技术,还能进行结果分析,可视化网络输出等。

值得注意的是,xAI 在 Grok 的开发中大量的使用了该技术。

借助 PromptIDE,工程师和研究人员可以透明的访问 Grok-1 模型(为 Grok 提供支持的模型)。该 IDE 可以帮助用户快速探索我们大模型 (LLM) 的功能。IDE 的核心是一个 Python 代码编辑器,它与新的 SDK 相结合,可以实现复杂的 prompt 技术。在 IDE 中执行 prompt 时,用户会看到一些比较有用的分析,例如采样概率、聚合注意力掩码等。

该 IDE 会自动保存所有的 prompt 并具有内置版本控制,还允许用户比较不同 prompt 技术的输出。最后,用户可以上传 CSV 文件等小文件,并使用 SDK 中的单个 Python 函数读取它们。结合 SDK 的并发特性,即使是稍大的文件也能快速处理。

下面是 IDE 主要功能演示。

代码编辑器 & SDK

图片

PromptIDE 的核心是代码编辑器 + Python SDK,其中 SDK 提供了一种新的编程范式,可以实现复杂的 prompting 技术。 

如上图所示,用户可以使用 prompt () 函数手动将 token 添加到上下文中,也可以使用 sample () 函数根据上下文生成 token。 

图片

此外,多个 web worker 可以同时运行,这意味着用户可以并行执行多个 prompt。

用户也可以使用同一程序中的多个上下文来实现复杂的 prompting 技术。如果函数使用 @prompt_fn 装饰器进行注释,则它将在自己的新上下文中执行,该函数可以独立于其父上下文执行一些操作。这种编程范式支持具有任意嵌套子上下文的递归和迭代 prompts。

并发性:SDK 使用 Python 协程来并发处理多个带 @prompt_fn 注释的 Python 函数,从而加快时间进程,尤其是在处理 CSV 文件时。

用户输入:Prompt 可以通过 user_input () 函数进行交互。user_input () 函数返回用户输入的字符串,然后可以通过 prompt () 函数将其添加到上下文中。使用这些 API,只需四行代码即可实现聊天机器人:

文件:开发人员可以将较小的文件上传到 PromptIDE(每个文件最多 5 MiB,总共最多 50 MiB),并在 prompt 中使用他们上传的文件。read_file () 函数以字节数组形式返回任何上传的文件。这些与上面提到的并发特性结合起来,可以实现对 prompt 进行批处理。

分析:在执行 prompt 时,用户会看到详细的 token 分析,以帮助他们更好地理解模型的输出。

图片

当用户使用 user_input () 函数时,窗口中会显示一个文本框,用户可以在其中输入响应。下面的屏幕截图显示了执行上面列出的聊天机器人代码片段的结果。

图片

最后,当不需要对 token 进行可视化时,还可以以 markdown 方式呈现上下文,以提高易读性。

责任编辑:张燕妮 来源: 机器之心
相关推荐

2023-11-06 12:46:00

AI数据

2022-11-02 14:02:02

强化学习训练

2023-12-08 13:22:00

数据模型

2022-01-06 09:57:02

数据计算机神经网络

2021-08-10 15:51:55

谷歌模型技术

2021-12-06 09:53:09

自然语言神经网络人工智能

2020-07-29 12:16:12

预训练自训练神经网络

2022-03-10 09:48:11

人工智能机器学习模型

2023-11-13 09:11:00

模型谷歌

2021-09-10 16:31:56

人工智能机器学习技术

2021-10-27 15:57:48

机器学习人工智能计算机

2023-06-26 07:10:51

2021-02-09 09:51:58

异步传递数据

2019-11-14 08:00:00

微软EdgeLinux

2023-03-28 16:01:01

PytorchSimCLR算法

2013-10-18 15:49:15

微软大数据微软

2020-10-18 18:02:32

AI机器学习微软

2024-01-03 18:53:13

语言模型LLM

2020-11-29 20:24:13

数据谷歌DeepMind

2015-05-05 09:50:45

大数据实现块数据
点赞
收藏

51CTO技术栈公众号