技术分享
国产自主指令集 开源编译器LLVM已经支持龙芯LoongArch架构
龙芯中科于2021年正式推出具有完全自主知识产权的LoongArch自主指令集,具有完全自主、技术先进、兼容生态三大特点,现在开源编译器LLVM也开始支持龙芯的LoongArch指令集了,这对龙芯生态发展意义重大。
从社区来看,LLVM 15.0的开发树上已经出现了支持LoongArch架构的补丁,目前的支持还是初步的,部分补丁被合并到了主线上,后续还有很多工作要做,但这也是龙芯生态的一个重要进步。
LLVM底层虚拟机(Low Level Virtual Machine),跟GCC、Clang并称为三大编译器之一, 更准确地说,LLVM是一套编译器基础设施项目,以C++写成,包含一系列模块化的编译器组件和工具链,用来开发编译器前端和后端。
2021年4月15日,龙芯正式发布了自主指令系统架构“Loongson Architecture”,简称为“龙芯架构”或者“LoongArch”,已经通过了国内第三方知名知识产权评估机构的评估。
LoongArch包括基础架构部分,以及向量扩展LSX、高级向量扩展LASX、虚拟化LVZ、二进制翻译LBT等扩展部分,总共接近2000条指令,同时不包含龙芯此前使用的MIPS指令系统。
LoongArch具有完全自主、技术先进、兼容生态三个方面的特点,它还可以同时兼容MIPS、ARM、x86等其他指令集,对MIPS指令的翻译效率是100%,对ARM可以达到90%,
国产最大算力通用GPU上市:超越NVIDIA、AMD
近期,国内GPU厂商集中推出自研GPU产品,取得了不小突破。而随着壁仞科技发布BR100系列GPU,也宣告国内最大算力通用GPU芯片正式落地。
参数方面,BR100系列基于7nm制程工艺打造,拥有770亿个晶体管。由壁仞科技自主原创的芯片架构开发,采用Chiplet(芯粒)、2.5D CoWoS等先进的设计、制造与封装技术,可搭配64GB HBM 2E显存,超300MB片上缓存,支持PCIe 5.0、CXL互联协议等。
性能是BR100最具亮点的地方,拥有1024 TOPS INT8,512 TFLOPS BF16、256 TFLOPS TF32+、128 TFLOPS FP32,可实现2.3TB/s的外部I/O带宽,支持64路编码、512路解码等,号称在FP32(单精度浮点)、INT8(整数,常用于人工智能推理)等维度,均超越了国际厂商最新旗舰。
从基本参数和数据来看,这里的“最新旗舰”应该是指NVIDIA Ho。