Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

人工智能
Stability AI去年8月份就已发布了一个初代版本Stable Code Alpha 3B,Stable Code 3B是其进化版。但开发团队表示,Stable Code 3B是首个主要版本,基于Stable LM 3B基础模型打造,并增加了多项附加功能。

Stability AI开年第一个大模型来了!

名为Stable Code 3B,参数27亿,专为写代码而生。

图片

Stable Code 3B可理解处理18种不同的编程语言,上下文长度100K token

且它对硬件要求也不高,用MacBook Air等普通笔记本电脑也能离线运行

图片

性能方面,Stable Code 3B规模比CodeLLaMA 7B小60%,但性能却大差不差。

BigCode评估中,在包含多种编程语言的MultiPL-E数据集上,Stable Code 3B与类似大小的模型相比,都拿下了SOTA性能。

图片

Stable Code 3B刚上线,有网友反馈已经在插件中用上了:

效果非常好!体积小,兼容各种硬件且运行速度非常快。

图片

Stable Code 3B长啥样?

在此之前,Stability AI去年8月份就已发布了一个初代版本Stable Code Alpha 3B,Stable Code 3B是其进化版。但开发团队表示,Stable Code 3B是首个主要版本,基于Stable LM 3B基础模型打造,并增加了多项附加功能。

其中就包括支持中间填补(FIM)等新功能,并使用RoPE(旋转位置嵌入)方法,将上下文长度从16000 token拉长至100000 token。

Stable Code 3B整体架构类似于LLaMA,是一个仅解码器模型,使用Flash Attention 2算法。

图片

支持以下18种编程语言:

C、CPP、Java、JavaScript、CSS、Go、HTML、Ruby、Rust、Markdown、Shell、Php、Sql、R、Typescript、Python、Jupyter-Clean、RestructuredText

下面是对性能比较的补充。

面对比自己大两倍多的CodeLLama 7B,Stable Code 3B的性能也差不多能与其打个平手,在Python、CPP语言上甚至略胜一筹。

图片
图片

在类似大小的模型中,Stable Code 3B表现突出。

图片

不过也有吐槽声

虽然Stable Code 3B收到了一波好评,但也有不少网友认为“没有太多新东西”、“没有那么好”。

图片

此外,它仅支持英语和编程语言,也是让大家有些许失望。

图片
图片

对此,你怎么看?

参考链接:
[1]https://huggingface.co/stabilityai/stable-code-3b

[2]https://twitter.com/StabilityAI/status/1747348018884493623

责任编辑:姜华 来源: 量子位
相关推荐

2023-08-10 14:04:15

代码模型

2023-10-04 09:20:04

模型训练

2017-05-11 14:00:02

Flask请求上下文应用上下文

2023-07-11 10:02:23

2024-03-14 08:11:45

模型RoPELlama

2023-07-24 12:27:08

论文斯坦福

2023-05-14 14:15:00

GPT-4AI

2012-12-31 10:01:34

SELinuxSELinux安全

2022-09-14 13:13:51

JavaScript上下文

2021-05-25 11:10:36

GitLinux

2022-09-15 08:01:14

继承基础设施基础服务

2024-03-11 13:20:00

模型AI

2023-03-31 13:37:34

研究

2021-01-26 05:19:56

语言Go Context

2017-12-17 17:01:23

限界上下文系统模型

2022-10-28 16:24:33

Context上下文鸿蒙

2024-03-29 14:04:00

模型训练

2020-07-24 10:00:00

JavaScript执行上下文前端

2021-07-26 07:47:36

Cpu上下文进程
点赞
收藏

51CTO技术栈公众号