芯片解密|芯片破解|芯片复制|单片机解密|IC解密| PCB抄板|软件开发

飞芯科技-芯片解密|芯片破解|芯片复制|单片机解密|IC解密| PCB抄板|软件开发

IBM 推出Granite 3.2芯片解密

IBM 推出 Granite 3.2 大语言模型,体现 IBM 发展企业专用、小型、高效与实用 AI 的策略。


所有 Granite 3.2 模型均采用宽松的 Apache 2.0 开源授权条款,可在 Hugging Face 下载。部分模型现已在 IBM watsonx.ai、Ollama、Replicate 和 LM Studio 上提供,预计不久将支援 RHEL AI 1.5,为企业与开源社区注入更强大的 AI 能力。


主要亮点


  • 芯片解密全新视觉语言模型:专为理解文件任务而设计,在关键企业基准测试 DocVQA、ChartQA、AI2D 和 OCRBench[1] 中,表现可媲美甚至超越更大规模的模型(如 Llama 3.2 11B 和 Pixtral 12B)。除了强大的训练数据外,IBM 也利用其开源 Docling 工具包处理8千5百万份 PDF 文件,并生成2千6百万个合成问答配对,提升视觉语言模型在处理大量文件工作流时的能力。
  • 增强推理功能:Granite 3.2的2B与8B模型加入了「思维链」(Chain of Thought,CoT)推理机制,且使用者可以开启或关闭推理功能以优化效率。通过这项能力,8B 模型在 ArenaHard 和 Alpaca Eval 等指令遵循基准测试中的表现[2],比前一代优异比例达到两位数,且不影响其他领域的安全性或性能。此外,通过创新的推理扩展方法,Granite 3.2 8B 模型可以调整至接近 Claude 3.5 Sonnet 或 GPT-4o 在数学推理基准(如 AIME2024 和 MATH500[3])上的表现。
  • Granite Guardian 安全模型更轻巧:在保持 Granite 3.1 Guardian 模型性能的同时,模型尺寸减少三成。此外,Granite 3.2 系列还引入了语言化信心评估(Verbalized Confidence)新功能,可提供更精细的风险评估,帮助安全监测系统识别不确定性。


IBM 持续推动企业专用的小型 AI 模型策略,并已在测试中展现高效能。例如,Granite 3.1 8B 模型在 Salesforce 大型语言模型CRM基准测试中获得高分,显示其在实际应用中的准确度和可靠性。


IBM Granite 模型家族拥有广大的合作伙伴生态体系,许多领先的软件公司已将Granite模型嵌入其技术。Granite 3.2 是 IBM 在推动企业专用小型 AI 方面的重要进展,体现了 IBM 致力于提供小型、高效、实用 AI 的产品策略。


CrushBank 首席技术官 David Tan 表示:"在 CrushBank,我们亲眼目睹了 IBM 开放、高效的人工智能模型如何为企业人工智能带来真正的价值--在性能、成本效益和可扩展性之间实现适当的平衡。Granite 3.2 通过新的推理功能更进一步,我们很高兴能在构建新的代理(智能体)解决方案时探索这些功能。"


Granite 3.2 是 IBM 产品组合和战略发展的重要一步,旨在为企业提供小型实用的 AI。虽然思维链在推理任务中表现强大,但它需要大量计算资源,并非所有任务都必须启用。因此,IBM 在 Granite 3.2 模型中加入了程式化开关功能,使用者可以根据需求开启或关闭推理模式;模型可在不启用推理的情况下运行较简单的任务,以降低不必要的计算成本。


此外,芯片解密其他推理技术(例如推理扩展 Inference Scaling) 已显示 Granite 3.2 8B 模型能够在标准数学推理基准测试中,媲美甚至超越更大模型的性能。持续发展这项推理技术也是 IBM 研究团队的重点方向[4],以进一步提升 AI 的效能与应用范围。



联系方式

地址:石家庄市新华区民族路77号华强广场D座2009
电话:0311-88816616/87087811
手机:13315190088
传真:0311-67901001
联系人:张工
网址:www.feixindz.com
邮箱:feixindz@163.com
微信:xinpianjiemi
QQ:527263666/568069805

在线客服
热线电话

企业微信