跳转到内容

IBM Granite

维基百科,自由的百科全书
IBM Granite
IBM Granite的萤幕截图
IBM Granite的萤幕截图
开发者IBM Research[1]
首次发布2023年11月7日,​17个月前​(2023-11-07
平台IBM Watsonx (initially)
GitHub
Hugging Face
RHEL AI
类型
许可协议Proprietary
Code models: Open Source (Apache 2.0)[2]
网站www.ibm.com/granite 编辑维基数据

IBM Granite是由IBM于2024年发展的一系列解码器单元AI基础模型[3]于2023年9月7日宣布[4][5],并在4天后发表了初步论文。[6]最初该计划用于IBM基于云端运算数据生成式人工智能平台Watsonx,[7]IBM开源一些语言模型的源代码。[8][9] Granite模型从互联网学术出版物代码数据集、法律和金融文件等资料组合来训练。[10][11]

基础模型

[编辑]

基础模型是指在大规模且多元资料上进行训练的人工智能模型,因此能够适用于各种下游任务。 [12]

Granite的第一批基础模型分别为 Granite.13b.instruct 与 Granite.13b.chat。它们名称中的“13b”取自模型拥有的130亿个参数,低于当时大多数较大型语言模型的参数数量。后续模型的参数规模介于30亿至340亿之间。[4][13]

2024 年5月6日,IBM依据Apache 2许可证释出了四个版本的Granite程式码模型源代码。该许可证为一个开放源代码的宽松授权,允许使用者完全免费地使用、修改及分享软件,IBM同时将这些模型上传至Hugging Face平台供公众使用。[14][15]

根据IBM的报告,在参数规模相近的情况下,Granite 8b在多项与程式设计相关的任务上均超越了Llama 3的表现。[16][17]

参见

[编辑]

参考资料

[编辑]
  1. ^ McDowell, Steve. IBM's New Granite Foundation Models Enable Safe Enterprise AI. Forbes. 
  2. ^ ibm-granite/granite-code-models, IBM Granite, 2024-05-08 [2024-05-08] 
  3. ^ IBM Granite. IBM. 2024-06-24 (英语). 
  4. ^ 4.0 4.1 Nirmal, Dinesh. Building AI for business: IBM's Granite foundation models. IBM. 2023-09-07 (英语). 
  5. ^ IBM debuts Granite series of hardware-efficient language models. 2023-09-07 (英语). 
  6. ^ Granite Foundation Models (PDF). IBM. 2023-11-30 (英语). 
  7. ^ Fritts, Harold. IBM Adds Meta Llama 3 To watsonx, Expands AI Offerings. StorageReview.com. 2024-04-22 [2024-05-08] (美国英语). 
  8. ^ Jindal, Siddharth. IBM Releases Open-Source Granite Code Models, Outperforms Llama 3. Analytics India Magazine. 2024-05-07 [2024-05-08] (美国英语). 
  9. ^ Open sourcing IBM's Granite code models. 2021-02-09 (英语). 
  10. ^ Azhar, Ali. IBM Patents a Faster Method to Train LLMs for Enterprises. Datanami. 2024-04-08 [2024-05-08] (英语). 
  11. ^ Wiggers, Kyle. IBM rolls out new generative AI features and models. TechCrunch. 2023-09-07 [2024-05-08] (美国英语). 
  12. ^ Introducing the Center for Research on Foundation Models (CRFM). Stanford HAI. 18 August 2021. 
  13. ^ Pawar, Sahil. IBM Introduces Granite Series LLM Models for Watsonx Platform. Analytics Drift. 2023-09-11 [2024-05-09] (美国英语). 
  14. ^ Nine, Adrianna. IBM Makes Granite AI Models Open-Source Under New InstructLab Platform. ExtremeTech. 2024-05-07 (英语). 
  15. ^ IBM open-sources its Granite AI models - and they mean business. ZDNET. [2024-05-21] (英语). 
  16. ^ Jindal, Siddharth. IBM Releases Open-Source Granite Code Models, Outperforms Llama 3. Analytics India Magazine. 2024-05-07 [2024-05-09] (美国英语). 
  17. ^ Synced. IBM's Granite Code: Powering Enterprise Software Development with AI Precision | Synced. syncedreview.com. 2024-05-13 [2024-05-21] (美国英语). 

外部链接

[编辑]