Hugging Face发布新开源编程大语言模型StarCoder :可自动写代码、根据指令改代码
站长之家(ChinaZ.com)5月9日 消息:企业工作流公司 ServiceNow 和 ML 工具开发商 Hugging Face 开发了一种用于编码的开源大型语言生成 AI 模型——StarCoder LLM。
这是一个150亿参数的模型,旨在为开放式人工智能研究社区负责任地生成代码。StarCoder 是 ServiceNow 和 Hugging Face 研究人员采用StarCoderBase模型的结果,该模型根据来自 GitHub 的许可数据进行训练,涵盖80多种编程语言,并在350亿个 Python token上对其进行微调。
【资料图】
据称,StarCoder LLM模型优于现有的开放代码生成模型以及封闭模型,例如 OpenAI 的 code-cushman-001,这是为早期版本的GitHub Copilot提供支持的原始Codex模型。
根据 ServiceNow 和 Hugging Face 的说法,该模型拥有超过8,000个token的上下文长度,这意味着它可以处理大量输入,从而“启用各种有趣的应用程序”。
Hugging Face 研究人员在一篇博文中解释说:“例如,通过用一系列对话提示 StarCoder 模型,我们让它们充当技术助手。此外,还可用于自动完成代码、通过指令修改代码以及用自然语言解释代码片段。”
StarCoder 与几个类似的模型进行了比较,包括 Google 的PaLM和LaMDA以及 Meta 的LLaMA。使用包括 HumanEval 在内的多个基准对模型进行了评估。
尽管体积小得多,但研究人员发现 StarCoder 和底层的 StarCoderBase 都优于其竞争对手。
该团队还观察到,通过强制模型生成实际的编码解决方案,它提高了性能得分。据其背后的研究团队称,StarCoder 还在多语言基准测试 MultiPL-E 上进行了测试,并取得了同样令人印象深刻的结果。
StarCoder 在 Hugging Face 宣布其已开发开源版本的 ChatGPT“ Hugging Chat”之后发布的。
StarCoder LLM网址:https://huggingface.co/bigcode/starcoder
存储库:bigcode/Megatron-LM
项目网站:bigcode-project.org
Hugging Chat网址:https://huggingface.co/chat/
(举报)
相关阅读
精彩推荐
- Hugging Face发布新开源编程大语言模型StarCoder :可自动写代码、根据指令改代码
- 最高涨幅40%!MLCC下游三领域需求拉升 行业上行拐点将至?
- 辽通卡etc官网下载_辽通卡_焦点简讯
- 保值率榜丨4月新能源交付榜品牌热销车型
- 环球今日讯!再夺劳伦斯大奖,为什么评选获奖的总是梅西?
- 快看点丨5月9日盘前停复牌汇总
- 世界关注:2023年5月9日操盘必读:影响外汇市场的利好与利空消息集锦
- 2023年永磁电机上市公司龙头一览表(2023/5/9) 前沿热点
- 【时快讯】网商贷逾期真的会上门吗?网商贷逾期延期最新政策是什么?
- 全球即时:监管部门十方面举措规范房地产经纪服务
- 好聚难好散,百亿量化私募再现“分家”之争|当前热闻
- 百奥泰:控股股东一致行动人拟共减持不超2.54%股份_每日视点
- 180Hz超高刷新率!外星人27寸电竞屏便宜了|环球速看料
- 环球热文:台湾4月出口数据年减13.3% 呈现“连八黑”
- 全球通讯!洁厕灵与84消毒液反应方程式_洁厕灵与84消毒液反应
- 它才是滴滴神车,一箱油能跑1100公里,入华至今0差评,仅售6.98万
- 吕布、公孙离限定返场,花木兰红衣传说巨美,留三颗水晶稳赚|当前快播
- “红色故都”江西瑞金开行首趟铁海联运图定班列|全球视讯
- 三夏指的是多长时间_三夏是什么意思|今日精选
- 网信部门工作组进驻斗鱼平台
- 热文:哪些案件由中级法院审判
- 当前焦点!平舆交警持续开展酒醉驾集中整治行动
- 男子花 86 万买下二手房后得知是凶宅,法院:前房主隐瞒“凶宅”事实的行为构成欺诈-快资讯
- 环球最新:太阳当空照,气温飙得高!本周河南最高气温将升至30℃以上
- 2023把爱带回家“母亲邮包”公益探访活动在全州县举行-当前快播
- 环球关注:发票显示离线时间超限_发票离线时间超限怎么解决
- 神经形态处理和自搜索存储如何降低数据风险|全球关注
- 天天精选!中钨高新:年内钨矿价格维持平稳上涨的可能性较大
- 唐三喝朱竹青的奶乳_奶乳图
- 做家务的男人张继科惠若琪哪一期_做家务的男人是一档什么节目