2023年开放计算社区中国峰会(OCP China Day 2023)上发布了《开放加速规范AI服务器设计指南》,该指南旨在进一步发展和完善开放加速规范AI服务器的设计理论和设计方法,以助力社区成员高效地开发符合规范的AI加速卡,并缩短与AI服务器的适配周期此指南的发布将有望为业界提供更多关于生成式AI算力产业的巨大机遇。
2019年OCP成立了OAI小组,对适用于超大规模深度学习训练的AI加速卡进行了定义,并发布了OAI-UBB1.0设计规范,为开放加速规范AI服务器的产业化实践奠定了基础。
《开放加速规范AI服务器设计指南》提出了四大设计原则:应用导向、多元开放、绿色高效、统筹设计。此外,该指南还倡导多维协同设计、全面系统测试和性能测评调优等设计方法。多维协同设计强调系统和芯片厂商在规划初期的全面协同,以最大程度减少定制开发的内容,从而提高适配部署效率。
全面系统测试则强调对异构加速计算节点进行更全面、严格的测试,以降低系统故障风险。性能测评调优关注多层次的性能评测和软硬件深度调优,以确保开放加速规范AI服务器能够有效支持当前主流大模型的创新应用。(美通社头条)