摘要:近年来,人工智能产业发展十分迅速,涌现出了一大批的AI算法初创公司,与此同时谷歌、BAT等互联网公司也纷纷杀入,但是随着AI技术的逐步成熟,这个领域的竞争变得越来越激烈。

图片 1

在人工智能(AI)时代,此前物联网(IoT)领域的AI芯片往往身陷困局,传统CPU算力不足,AI协处理器的面积和功耗又偏大。为了打造一款高效率低功耗的AI芯片,创企们纷纷用起存储优先、存算一体等各种招式,还有一类招式是用RISC-V经开源设计打造的AI芯片,因其低功耗的优势迅速在IoT行业崭露头角。

图片 2

撰文 | 寓扬

近两年来,在ARM和Intel主导的竞争格局中,一个新的开源指令集架构RISC-V在芯片江湖声名鹊起。

AI算法芯片化已是大势所趋

去年11月份,面向广阔的物联网市场,Arm中国推出人工智能平台「周易」,它主要包括人工智能处理单元,以及软件框架Tengine。当时Arm中国称,通过周易平台,能够把芯片的开发周期缩减3-5倍,提升人工智能应用开发的生产效率。

面对来势汹汹的AI和IoT浪潮,RISC-V提供了一种高能效低成本解决方案,吸引了谷歌、高通、IBM、镁光、西部数据、三星、英伟达、惠普、甲骨文、华为、比特大陆、加州大学伯克利分校、麻省理工学院、普林斯顿大学、新加坡南洋理工大学以及中科院计算所等国内外200家左右的企业和科研机构加盟。

近年来,人工智能产业发展十分迅速,涌现出了一大批的AI算法初创公司,与此同时谷歌、BAT等互联网公司也纷纷杀入,但是随着AI技术的逐步成熟,这个领域的竞争变得越来越激烈。

值得一提的是,2018年Arm在中国进行业务分拆后,Arm中国成为中方占主导的合资公司。周易平台也是由Arm中国自主研发。

阿里平头哥用其主攻IoT安全功能,华米用其造出全球首款支持AI的可穿戴设备芯片组,邻国印度将其确立为国家指令集……和其他传统架构相比,RISC-V具有低功耗、低成本、灵活可扩展、安全可靠等四大优势。据不完全统计,有5家科技老手和6家创业新秀的产品直接或间接的瞄准了基于RISC-V架构的AI芯片。

特别是在谷歌、百度等厂商将很多AI算法及工具开源之后,开发AI算法及应用的门槛开始大幅降低,与此同时很多AI算法厂商还纷纷将一些基础的AI算法能力免费向开发者提供,比如百度将其语音AI能力免费开放,虹软也将其基础的视觉AI能力免费对外开放。这些都加剧了AI算法市场的竞争。

在最近的一次媒体沟通会中,Arm中国进一步介绍了周易平台,尤其是AIPU的特性,并着重介绍了周易平台的落地应用情况,以及相比时下火热的RISC-V架构的优势。

图片 3

为了进一步提升自身的竞争力,越来越多的AI算法厂商开始纷纷进入半导体领域,不再选择第三方的芯片作为载体,而是将“算法芯片化”,打造更为适合自己需求的,更具能效的,具有自主IP的专用型AI芯片,用以替代第三方的芯片。

AI芯片最重要的是什么?Arm中国给出的答案是,芯片背后的整套软件工具链。可以预测,在2020年之前,对整个产业来说谁的软件好用,谁就能真正的掌控市场。

阿里平头哥蓄势待发,华米打响可穿戴AI芯片头炮

以国外厂商为例,Google很早就推出了自研的TPU;2017年,Intel以150多亿美金收购了ADAS/自动驾驶AI芯片及解决方案厂商Mobileye,此外还收购了AI芯片公司Movidius;2018年,亚马逊也曝光了自己的云端AI芯片;不久前,特斯拉也推出了自己的自动驾驶AI芯片。

软银董事长孙正义曾预测,2035年全球将有万亿级IoT设备在线。相比而言,PC时代的容量大约为10亿台,智能手机的容量约为60亿部,而物联网所带来的设备体量将会是成百上千倍的增长。

RISC-V是一种基于精简指令集计算原理建立的开放指令集架构(ISA),由2017年新晋图灵奖得主、加州大学伯克利分校的Dave
Patterson教授带领团队设计研发。

在国内市场也同样如此,在过去的一年,我们可以看到,百度发布了自己的云端AI芯片“昆仑”,云知声、Rokid、云天励飞等AI算法厂商都推出了基于自己算法定制的AI芯片。

Arm中国每年的销量统计数据也有力的支撑这一预测。Arm中国生态发展副总裁、OPEN
AI
LAB创始人兼CEO金勇斌也介绍道,从1991年到2017年,Arm花了近26年实现了1000亿基于Arm芯片的设备。但从2017年开始每年有250亿台基于Arm芯片的设备,预计到2020年,这4年就会实现第二个1000亿。以此估算,到2035年达到1万亿连接设备,这一观点并不激进。

阿里巴巴今年9月创建的平头哥半导体公司是由阿里巴巴全资收购的杭州中天微和阿里达摩院合并而成,主要发力于32位高性能和低功耗嵌入式CPU的IC设计。

显然,对于AI算法厂商来说,自己来做AI芯片或模组,一方面可以脱离单纯的AI算法授权的商业模式,脱离AI算法领域的激烈竞争,通过向产业链上下游延伸,拉高竞争壁垒,同时可以提升自身的核心竞争力,推动生态建设,加速AI算法的产品化落地。

正是看到AI与IoT领域的市场前景,去年在世界互联网大会期间,Arm中国推出AI平台「周易」。它主要包括两部分,一部分是平台上的软件框架Tengine,用来承载算法应用;另一部分是AI处理单元AIPU,专门处理深度神经网络为代表的AI计算。可以说,Tengine软件框架和AI处理单元构成了周易平台的核心要素。

就在合并的2周前,中天微宣布基于RISC-V的第三代C-SKY指令架构,同时发布基于RISC-V第三代指令架构处理器CK902,可灵活配置TEE引擎,支持IoT安全功能。

但是,对于大多数的AI算法厂商来说,由于缺乏半导体芯片的研发人才积累、技术积累和经验积累,这也使得他们在将AI算法芯片化的过程中会遇到非常多的难题和挑战。

图片 4

图片 5

针对这这一趋势,全球知名的EDA工具及IP厂商新思科技早前就推出了一套能够实现专用指令集处理器开发流程自动化的工具——ASIP
Designer,可以助力AI算法厂商快速高效的实现“算法芯片化”。

其中,Tengine框架不依赖于AIPU或者专用AI芯片,现有的成熟芯片通过Tengine框架可以把算力提取出来,在本地进行一些AI应用的处理,从而提高了芯片性能,并降低成本。

截至9月,中天微基于C-SKY CPU
IP核的SoC芯片累计出货量已经突破8亿颗。中天微还将针对不同的产品应用场景和客户设计需求,持续推出支持RISC-V的CPU
IP系列。

什么是ASIP?

据金勇斌介绍,现在很多基于周易平台Tengine的使用场景已经落地,比如行车记录仪、ADAS、安防中的人脸识别门禁和闸机等。

此外,中天微与小米旗下的松果电子在11月宣布就RISC-V达成全方位的战略合作伙伴关系并进行联合开发,以中天微RISC-V
CPU处理器为基础平台,松果电子提供极具市场竞争力的SoC智能硬件产品。

ASIP即“专用指令集处理器”,是针对特定应用场景的功能需求而设计的一类“指令集处理器”。与之相对的是,比如Arm的Cortex
CPU内核则是属于“通用型指令集处理器”。相对于“通用型指令集处理器”,ASIP在特定应用场景下可以获得更为出色的性能、面积、功耗和成本等竞争优势。

他举例介绍道,一个客户开发了一套智能人口管理系统,在单元楼下安装摄像头后,以前需要将采集的人脸数据传到后端数据中心进行处理。现在通过Tengine架构,不需要改动硬件,摄像头就可以自动在前端进行人脸识别,这样大大减少了网络部署成本。据他估算,周易平台所带来的效率提升,可节省近10倍成本。

同样在今年9月,小米生态链首家在美国上市的公司华米科技推出了首款RISC-V架构的可穿戴设备黄山1号,并称是全球首款支持AI的可穿戴设备芯片组。

这里需要区别的是,ASIP并不等于专用型处理器ASIC,我们通常所说的ASIC芯片是一个完整的芯片,其不仅包括针对特定算法设计或优化的内核,还包括了外围的电路、接口等等。

整体而言,金勇斌称,通过周易平台可以降低AI芯片开发的两个门槛:第一个是SoC集成AI功能的设计门槛,Arm中国可以提供参考设计,提供IP;第二点是降低上层软件的开发门槛,因为仅有芯片还远远不够,芯片之上的软件框架,以及这背后的整套软件工具链都尤为关键。软件最终决定能不能大规模使用,对整个产业来说谁的软件好用,谁就能真正地掌控市场。

图片 6

ASIP有何优势?

周易平台的另一个核心要素是人工智能处理单元AIPU,Arm中国重点介绍了AIPU的特性,以及它相对于市面上另一种流行架构DSP的优势。

华米的这款可穿戴AI芯片由一颗主频可达240MHz的处理器和HeartID、ECG、ECG
Pro、Arrhythmia四个AI引擎组成,实现在本地端对心率、心电、心律失常等心脏问题进行24小时低功耗实时监测分析。

对于算法厂商来说,虽然市场上有很多现成的处理器内核可选,但为了覆盖更多的用户和市场,这些处理器内核往往都是偏向“大而全”,性能、面积、功耗也一定不是最优的。并且,这些内核都是固定的,难以进行修改的,更不能根据自己的应用需求去优化。

Arm中国资深产品经理高锦炜介绍道,AIPU的最大特点是拥有一套AI和神经网络优化指令集,这个指令集也遵循Arm一直以来的生态方式,接下来的每一代处理器都会向前兼容这个指令集,从而保证整体软件生态的延续。此外,周易AIPU还支持可扩展的指令集。

其创始人兼CEO黄汪在10月的采访中告诉智东西,和手机AI芯片不同,黄山1号可以在智能手表中作为一款协处理器芯片,配合主处理器工作,也可以在智能手环中扮演主处理的角色。

针对客户的特定需求来说,买来的处理器内核可能只有部分指令用得上,有很多的指令是用不上的,这就造成了浪费。比如,算法厂商需要设计一个处理器来跑自己的20条指令,如果要用Arm内核来做,可能其内部很多指令用不上,同时还需要搞定Arm内核里面的初始化和驱动,这就需要增加很多的指令,还会遇到面积、功耗、启动时间等一大堆的问题。

在硬件设计上,周易AIPU兼顾了神经网络处理器所需要的高效率,以及编程的灵活性。目前AI算法迭代很快,基本以一年为开发周期,而芯片的开发周期往往至少要3年。这种不对等性,就需要保持AI处理单元具有灵活的可编程性,从而适应不同的算法。

阿里平头哥和华米瞄准的是IoT领域,而美国的老牌FPGA供应商美高森美(Microsemi)的RISC-V相关产品则主打高速增长的医疗、工业等机器视觉系统市场。该公司不仅为嵌入式设计提供RISC-V
IP内核,并为该系列产品提供完整的工具链和基于RISC-V+Linux+CNN加速器的AI解决方案。

相对而言,由于算法厂商对于自己的算法非常熟悉,如果采用自定义的处理器架构和指令集,那么就可以实现极简化的按需设计,并且可以通过不断的修改和优化自己的架构,最终获得比市场上可以买到的处理器内核更好的效果,实现高性能、低功耗、面积更小、成本更低等优势。

在软件方面,周易平台提供了一整套完整的工具链,从IP开发到软件开发,包括编译器、性能优化库等,从而提供一键式开发服务。

美高森美与创企SiFive合作开发的RV32IM
RISC-V内核使客户能够利用开放式指令集架构(ISA)进行设计,通过许可的BSD授权,实现全面的移植性和更安全的处理器架构。

新思科技相关人士表示,“从自动驾驶汽车到医疗器械,从智能移动网络到空间应用,从安全到虚拟现实,几乎每个片上系统都需要或已经使用ASIP。ASIP能够满足专业处理要求,现成的商用处理器IP无法满足功率、性能、面积要求,固定功能硬件缺乏所需的可编程性。”

针对周易AIPU的落地情况,他称目前已经有唱衰基于AIPU做芯片设计,最快明年年中可以看到芯片推出。

设计人员可以将设计自由地从FPGA移植到ASIC,而无需支付权益金。此外,工程人员还可以针对其特定应用协作、修改和改编RISC-V内核,充分发挥创新水准。

ASIP Designer能做什么?

目前产业界不少企业用DSP来做AI处理,针对这种状况,高锦炜提出了他的看法。他认为DSP跟CPU一样已经发展了二十几年,但一直没有形成一个比较好的生态,这是因为DSP在设计过程中存在一些缺陷。

图片 7

虽然ASIP有很多的优势,但是ASIP的研发并不是一个简单的工作,其工作量非常的大,不仅需要基于特定算法定义一套处理器模型架构,还要进行架构优化和软件开发以及验证ASIP设计,除此之外,还必须考虑开发用于对所得设计进行编程的软件开发工具链需要完成的工作。

一方面,目前存在多个DSP架构,不同DSP架构之间并不兼容,这分散了整个产业软件投入的资源和开发精力;另一方面,DSP的开发没有软件生态维护的概念,这会造成即使是同一个厂家,第一代DSP的指令集或者软件程序,无法使用在第二代DSP上。这对于软件开发来说可能是灾难性的。

除了美高森美外,另一家IP公司台湾晶心科技在近日于美国硅谷举行的2018 ANDES
RISC-V CON大会上展示了基于RISC-V的产品。

新思科技推出的ASIP
Designer则是一套针对ASIP的开发流程自动化工具。其不仅能最大限度地减少开发专用处理器和相关编程工具所需的工程时间和工作量,而且还能加快理解候选设计的性能和效率。

随着物联网的蓬勃发展,新的开源指令集架构RISC-V在芯片江湖可谓声名鹊起。拥抱RISC-V的一种观点称,「RISC-V是IoT时代最适合的处理器架构」,因为从技术的角度来讲,RISC-V具备延展性,非常灵活,既可以做低功耗,也可以做复杂的AI计算。此外,它还具备更强的成本优势。

晶心科技是第一家纳入RISC-V的商用主流CPU
IP公司,该公司在大会上详细介绍了使用开放来源指令集架构(ISA)的6颗内核以及开发中的4颗内核,截至上个月,晶心科技的RISC-V内核在全球拥有12家授权商,被广泛用于储存服务器、指纹辨识器以及几种AI应用中。

下面简单解释下ASIP Designer这套工具的作用:

周易平台则是Arm架构从移动互联网向物联网的延伸,Arm中国又如何看待RISC-V架构的兴起?

除了上述提及的公司外,北京君正、中兴微、联发科等很多玩家的RISC-V计划正在进行中,西部数据、英伟达、三星等科技巨头也分别在公共场合表露将在旗下产品中用到RISC-V架构。

图片 8

金勇斌称,CPU做好其实并不容易,早期CPU有各种各样的架构,RISC-V也不是第一个开源的架构。世界上很多老牌的CPU厂商,包括TI、高通、海思等,他们原来也自己设计CPU,但后来都用了Arm架构,这取决于Arm在低功耗、高性能上的显著优势。AIoT时代,CPU要求更低的功耗,特别是芯片上面需要有软件生态,而RISC-V的软件生态什么时候形成还不清楚。

硬盘巨头西部数据在去年11月宣布,未来旗下硬盘处理器和控制器都逐渐转移至成RISC-V架构,一旦转型完成,预计每年将有20亿个基于RISC-V架构的内核出货。

比如一家AI算法厂商,希望开发出一个最为适合自己AI算法的处理器内核架构(完全自主设计,而不是基于Arm
CPU内核架构或者其他的CPU/GPU/DSP内核架构),那么这家AI算法厂商只需要自己定义一个架构,用nML语言就把它写出来,通过ASIP
Designer就可以自动生成一套SDK,包含优化的C/C
语言编译器、汇编器/反汇编器、链接器、周期精确以及指令精确的指令集仿真器和图形化调试器(适用于指令集仿真和片上调试)。这就形成了一个完整的最小化的嵌入式处理器内核模型及开发环境。

显然他想表达Arm在架构以及软件生态上的优势,接下来Arm也会依托这也优势进军IoT市场。

GPU王座英伟达表示将来会把旗下的GPU控制核心替换成RISC-V核,三星半导体也被指在其Exynos
8890处理器中首次采用基于开源的RISC-V架构的自主CPU内核M1。

图片 9

面对一个新的IoT市场,新的架构、新的芯片都会涌现,然而做一款芯片只是第一步,背后的软件生态和工具链将会决定这个市场的走向。

未来上述大公司或机构很有可能会将RISC-V运用到他们自己的云计算设施中,以摆脱对X86的依赖或是减少昂贵的ARM指令集授权费用。据悉欧盟超算机构EPI已经决定在规划中的两套下一代E级超算中的其中一套用上RISC-V处理器。

然后,算法厂商可以将自己的算法放到这个已经生产的嵌入式处理器内核模型及开发环境当中去运行,通过调试器和分析器来检测出来的结果对不对、效率高不高,进而发现一开始的”用户定义的架构“哪些地方有问题,哪些地方需要迭代修改。

ARM小师弟?RISC-V的诞生史

由于ASIP
Designer的所有编译器优化都以通用方式实现,编译器还可以自动可重定向。得益于编译器的即时可用性,使得用户可以通过ASIP
Designer实现快速的架构迭代,进而使编译结果能够在下一个迭代步骤中推动架构的进一步优化。另外对于算法厂商本身的算法需要快速迭代的需求,ASIP
Designer也可使得整个ASIP的设计能够及时的进行相应的快速迭代。

引得一众科技巨头为之站台的RISC-V,和当前移动终端的主流架构ARM却是师出同门。

据介绍,使用ASIP Designer完成一次完整的架构迭代可能只需要10分钟。

众所周知,芯片江湖有两大指令集架构纵横天下,复杂指令集(Complex
Intruction Set Computer,
CISC)的代表英特尔x86在PC市场无出其右,精简指令集(Reduced Intruction
Set Computer, RISC)的代表ARM则在移动终端独领风骚。

如果采用的是现成的固定的处理器内核,那么要完成一次算法的迭代需要修改非常多的东西,而且需要真正的仿真以后才能把这个算法跑起来。跑出来以后再看结果,再根据结果去修改,显然这个迭代过程非常的复杂。

两类指令集的命名都相当“集”如其名:CISC指令集约有20%的指令会被反复使用,占全程序代码的80%,靠设计出尽可能复杂的指令来完成任务;而RISC的理念更加精简,会采用固定长度的指令格式和单周期指令,优先选用最高频使用的简单指令。

而当ASIP整个软件代码迭代完成之后,接下来就可以往硬件方面做了。

上世纪80年代,加州大学伯克利分校的Dave Patterson教授主导了Berkeley
RISC项目并从零设计出第一代处理器RISC
I。因为当时市面的CPU价格太昂贵,英特尔又不肯给出x86的授权,英国Acorn公司的创始人Roger
Wilson和Steve Furber设计了第一款RISC微处理器——ARM(Advanced RISC
Machine)。

开发人员可以使用ASIP
Designer的RTL生成工具将设计好的nML模型转换为完全可综合的Verilog或VHDL。因为nML可以对处理器进行周期和位精确描述,所以设计人员可以完全控制硬件。

几乎是同一时间,曾斯坦福大学校长的John
Hennessy与其团队设计出MIPS处理器的早期雏形,并最终孵化出后来被Imagination收购的MIPS公司。

不但如此,ASIP
Designer还可以无缝对接新思科技的SoC的实现和验证工具。比如,开发人员可以使用新思科技的RTL仿真器VCS进行进一步的模拟设计,然后进行验证:验证处理器模型,确保指定的处理器模型实现所期望的行为;验证RTL模型,确保生成的RTL模型正确实现nML。

随着智能手机时代的到来,ARM以其低功耗、低成本和高性能的特点攻破微软和英特尔打造的PC壁垒,迅速在移动互联网的狂潮中建立起自己的生态,将苹果、高通、三星等一大批巨头拢入麾下,共同颠覆了传统互联网时代。

如果发现nML问题,则可以很容易返回到nML描述,并对模型执行必要硬件和/或软件修改以解决问题,例如超出功耗和/或面积预算。由于nML中的单一来源条目,SDK和RTL将始终保持同步。

图片 10

开发人员还可以进一步的进行模拟设计,然后使用Design
Compiler生成门级描述,门级描述可用于准确评估电路的功率要求和面积,甚至可以使用新思科技IC
Compiler等工具进入布局和布线过程,以探索路由拥塞的风险。这种“环路综合”方法可确保做出合理决策,并避免在设计过程的后期出现意外。

而如今AI、IoT等新兴技术的爆发,处理器指令集架构大有再有改朝换代之势。而这一轮新的变天风波的主角,正是ARM的同门师弟——第五代RISC处理器RISC-V芯片。

总结来说,ASIP
Designer功能强大,同时可结合新思科技其他丰富的配套的EDA工具,在兼容性和内部协同性上更为出色,极大简化了ASIP的设计流程,缩短了设计周期。如果是采用多个未全面整合的工具,那么就意味着需要在工具间进行某一设计版本移植,而这是引发错误的一个主要原因。而要解决发现的问题,通常需要与两个或两个以上的不同的工具供应商沟通获得技术支持,因此找出错误也将耗费大量的时间。

RISC-V是基于精简指令集(RISC)原理搭建的全新开源指令集架构(ISA),亦由David
Patternson教授带领完成。V既指第五代,又代表变化(variation)和向量(vectors)。

ASIP
Designer明显降低了就新设计项目采用ASIP所面临的障碍。无需聘请仿真器、调试器或编译器专家就可以获得专业的技术支持,可以帮助设计团队提高生产力和缩短上市时间。借助ASIP
Designer,设计团队可以:用ASIP替换固定功能硬件实现,进而避免设计和验证复杂且不灵活的状态;设计其自己专为特定算法量身定制的专用DSP,如图像处理、基带处理和音频处理;为高价值和差异化设计区块(如AI、第1层通信、矩阵运算)创建针对特定域的灵活加速器。

秉承“大道至简”的设计哲学,RISC-V基础指令集只有40多条,加上其他的模块化扩展指令总共几十条指令。
RISC-V的规范文档仅有145页,而“特权架构文档”的篇幅也仅为91页。

小结:

相比传言要上千万美元的ARM指令集架构的许可证,RISC-V以其完全开源、短小精悍的模块化设计、没有过时定义的束缚、没有严重的指令冗余、没有专利问题等优势开始吸引全球初创公司和研究机构的目光。

显然,对于这些AI算法厂商来说,采用ASIP
Designer完全可以设计出最为适合自身特定AI算法的具有自主知识产权的处理器内核,且可以加速算法IP化芯片化的迭代速度,降低流片失败风险。

国内创企方兴未艾,国外创企产品已出

正所谓好马配好鞍,要想真正把ASIP
Designer这个工具用好,也有着一定的门槛。

在科技巨头还在放话要支持RISC-V架构之时,国内外多家创企已经积极行动起来。

新思科技内部技术人员表示,”只有开发团队清晰明白自己需要的是一个什么样的硬件逻辑,才能够把自身算法发挥到最佳“。特别是在“用户定义架构”这个部分,非常考验AI算法厂商在软硬件结构定义的能力,需要一个非常有经验的,对于软硬件都非常精通的开发团队,才能够把ASIP
Designer用好。

今年10月29日,2008年创立于上海的企业乐鑫收到一个好消息。乐鑫“基于RISC-V指令集架构的ESP32-Marlin物联网芯片”项目入选上海经信委对软件和集成电路产业发展专项资金拟支持项目名单。

而据了解,目前一些海内外大客户已经开始引入ASIP
Designer,用于新的芯片的研发。国内外不少AI厂商、RISC-V芯片厂商也对ASIP
Designer表现出了极大的兴趣。

图片 11

编辑:芯智讯-浪客剑

芯来科技比乐鑫的成立晚了10年,却是国内第一家专注于IoT和边缘计算领域的RISC-V处理器内核IP公司,该公司推出了用于IoT应用的N200系列超低功耗RISC-V核心IP,据称和国外公司处于同一起跑线。

芯来科技的COO徐来告诉智东西,RISC-V和ARM间存在客观差距,所以该公司选择了ARM立足不问的IoT等领域。传统的IoT领域比较封闭,不像传统的手机处理器应用那么依赖生态,从这个点开始逐步完善IoT领域是个不错的策略。

其创始人胡振波是第一本RISC-V中文书《手把手教你设计CPU——RISC-V处理器篇》的作者,开发了中国第一款开放来源的RISC-V核心蜂鸟E203(Hummingbird
E203)。

在蜂鸟E203面世时,胡振波目睹了国外很多专业RISC-V内核IP公司陆续出现并飞速发展,其中SiFive公司能运行Linux的四核RISC-V内核已在中国大陆市场推广,而国内CPU业界迟迟未见行动,“着急”的胡振波毅然决然的成立了芯来科技。

而把芯来科技“逼”出来的关键要素之一SiFive即是美国一家从RISC-V项目团队孵化出的基于RISC-V的定制半导体供应商,它通过开放式架构处理器核心及自主式开发基于RISC-V架构芯片来帮助SoC设计。

该公司在今年5月就完成了5060万美元的C轮融资,华米科技也参与了该轮融资。今年6月,SiFive宣布推出其为嵌入式设备使用设计的可配置的小面积、低功耗微控制器(MCU)核心E2
Core IP系列。

除了SiFive之外,美国还有两家RISC-V创企的创始人都师从RISC-V的开创者David
Patterson,他们分别是OURS的创始人谭章熹博士和Esperanto的创始人Dave
Ditzel。

OURS公司在深圳设立的中资公司睿思芯科,仅用7个月就设计出了一款基于64位RISC-V指令集的AI芯片Pygmy,采用台积电28nm制程工艺,具有12个高度可编程AI加速引擎,主要针对神经网络以及CNN算法进行了优化,能够支持AI图像和语音的应用,能耗和面积明显优于同级别Arm架构芯片。

根据睿思芯科的说法,Pygmy对比同级别的Arm芯片,能耗下降85%,面积减少80%,相当于用一般的32位处理器的面积和功耗就实现了64位处理器的性能。这款AI芯片一次性流片成功,并在11月初世界互联网大会上David
Patterson的演讲中首次亮相。

另外,提供Pygmy芯片的同时睿思芯科还开发了编译器、SDK、工具链,基于GCC、LLVM等开源实现,可以支撑Pygmy用户更好的进行二次开发。

图片 12

Esperanto Technologies的总裁兼CEO Dave
Ditzel从事芯片工作有40年了。他在大学期间就参与了RISC-V指令集的开发,曾在英特尔工作6年,并曾领导微软一个重要的项目团队。

2014年,Dave Ditzel成立Esperanto
Technologies公司,旨在要打造能够以超低功耗运行AI软件的芯片,并希望最终打造出基于RISC-V等开源标准的最强计算性能的机器学习计算系统。

目前,该公司正在设计一款单芯片上的超级计算机,采用台积电7nm制程技术,能在每个芯片上放置具有完整64位RISC-V处理器的一千个ET-Minion处理器内核。Dave
Ditzel向智东西透露,明年Esperanto将有新产品投入市场。

图片 13

虽然同样是做基于RISC-V架构的处理器,法国创企Greenwaves
Technologies主要面向的是来自IoT等终端市场的边缘计算需求。

GreenWaves在今年3月推出了全球第一款RISC-V架构的超低功耗边缘计算处理器GAP8,采用台积电55nm
55LP制造工艺,旨在边缘端依赖电池做长期的复杂运算,可应用于噪音过滤、检测摄像头、纳米无人机等边缘设备,从而进一步扩展物联网市场。

该公司CEO Loic
Lietar告诉智东西,GAP8的架构使它不仅拥有比竞争对少高20倍的计算能力,而且在成本系统解决方案所需的电力方面,较竞争对手低2到3倍。

图片 14

他还介绍,GAP8计划在明年量产,而能效比GAP8提升6倍、浮点计算能力比GAP8提升2倍的GAP9将在明年12月份会进行出台,在2020年的一季度进行量产。

除了欧美国家之外,我们的邻国印度也推出了自研的基于RISC-V架构的芯片。

印度理工大学马德拉斯(IIT-M)研究团队推出了印度第一个自主微处理器Shakti。该项目始于2011年,该芯片的设计基于RISC-V指令集架构,使用180nm工艺,由印度空间研究组织(ISRO)的半导体实验室在昌迪加尔制造,可用于洗衣机、智能相机等智能设备中。
7月,英特尔位于美国俄勒冈州的工厂生产了300个Shakti的早期版本芯片“RISECREEK”。

图片 15

从Shakti处理器研究团队独立出来的印度创企InCore
Semiconductors针对从超低功耗IoT到台式计算机的边缘系统应用,正在打造基于RISC-V的处理器内核,以及深度学习加速器和SoC设计工具,并预计将在今年年底之前推出其首款核心。

RISC-V如何在IoT领域比传统CPU+AI引擎做的更好?

今年6月底,ARM曾开设了一个“质疑”RISC-V架构的网站riscv-basics.com,从成本、生态系统、碎片化风险、安全性和设计保证上对
RISC-V
进行攻击。这一举动被许多人解读为ARM已经感受到来自RISC-V的威胁。在遭到了RISC-V建网站反怼并引起众多厂商和软件社区的不满后,ARM在7月10日关掉该网站。

图片 16

然而众所周知,ARM在移动终端的地位稳如泰山、坚若磐石,“后来者居上”的可能性极低。那么为什么RISC-V这几年发展速度远超过其他处理器?它又为什么会被称为是IoT领域最适合的处理器架构呢?

总的来说,RISC-V指令集架构具有低功耗、低成本、开源开放、可模块化、简洁、面积小、速度快等优点,与IoT场景需求碎片化的、可定制化的特性十分契合。

1、低功耗

通常每个AI芯片在CPU上的耗能非常高,会致使整个续航能力下降。而RISC-V适合用于高效设计实现,开发者可根据应用需求灵活剪裁,再加上其全部RISC-V指令不超过50个,因此其内核面积更小,相应的功耗越低,能以极低的能耗来实现高效的AI元器件的运行。

华米创始人兼CEO黄汪告诉智东西,手机芯片需要不断使用最新的制程,而IoT芯片使用55nm/40nm非常成熟的半导体工艺就可以制作,55nm流片的工艺成熟度使得代工厂商的可选性很多,大陆、台湾、新加坡的均可,这就降低了依赖性。

2、低成本

RISC-V允许任何人免费设计、制造和销售RISC-V芯片和软件,无需像ARM那样购买昂贵的架构许可证。

据黄汪介绍,市面上不具备AI而只具备同样主频的芯片成本一般在2美金左右,而具备AI功能的芯片成本少于1美金,RISC-V在成本和功能上都大大跃进了一步。不同于手机芯片动则需要投入几亿美金,做颗芯片流片量产几千万人民币,不会太费钱。

GreenWaves创始人兼CEOLoic
Lietar也提到,其GAP8产品在成本系统解决方案所需要的电力方面,比它的同等其他的替代竞争对手要低2到3倍。

做处理器不仅要考虑硬件设计,还要考虑用它来进行编程的用户,所以也包含了工具链和相关生态建设。芯来科技COO徐来还提供了另一个角度,如果由一家公司承担这些建设,时间和资金投入的成本都会非常高,比如英特尔就花了几十年来做生态建设,而由于RISC-V是一个标准化指令集架构,很多不同公司和个人会参与到生态建设,均摊了研发成本。

3、灵活可扩展

RISC-V是一个模块化的架构,其不同部分能以模块化的方式串在一起,从而试图通过一套统一的架构满足各种不同的应用。

由于IoT场景非常广泛和碎片化,需要为数千种以多种不同方式连接世界的应用案例来设计芯片,因此可扩展的架构成为终端运算的关键。

和不同系列相互不兼容的ARM相比,RISC-V具有能够灵活地扩展指令集的优势,可以新增专用指令,也可以扩充边缘运算装置所需的运算资源,不仅能实现超低功耗的复杂AI计算,而且有助于推动架构创新以达到更高的能效。a

另外,x86、ARM、MIPS等架构的知识产权都属于某个特定的外国公司,无法在指令集架构上按自己的想法做修改和扩展,而且在工具链做的修改是没有人维护的。

特别是在IoT领域,徐来认为,比如在智能传感器等设备,只需要有限指令集,芯片面积又要求尽可能小,在这种情况下需要对现有处理器进行剪裁。相对于不能修改的x86、ARM等传统指令集架构,RISC-V因其开放性可以做一些剪裁。

而且IoT设备会长时间重复运行几个应用,不会像PC或手机那样需要安装和卸载不同应用,因此不存在对软件兼容性的依赖问题。

因其可扩展性,RISC-V的应用范围非常广阔。Loic
Lietar表示,RISC-V指令集设计的目标是能够满足从微控制器到超级计算机各种尺寸处理器的需求,不过目前看到的更多的是RISC-V
IoT终端处理器。

4、安全可靠

采用ARM等封闭式架构内核的平台,开发者看不到源代码,所以无法了解门级电路设计细节。一旦出现问题,开发者将不得不给原架构提供商打电话派人来解决问题。

不过RISC-V可以解决这一问题。RISC-V的用户可以查看内核的所有细节,可以全面检查每一行代码以确定系统的安全,甚至根据需要定制化自己的安全模块。相对于ARM,对产品安全要求高的人可能会更能接受RISC-V。

结语:RISC-V有望加强中国处理器IP的话语权

尽管从市场的实际情况来看,RISC-V取代ARM在移动终端等核心业务中的地位基本无望。但业界普遍认为,在IoT等新兴的边缘领域,RISC-V与ARM处于同一起跑线,两者将形成正面竞争,RISC-V在成本等方面具有优势,Arm在生态等方面具有优势。因此,RISC-V是很有希望促使中国加强处理器IP的话语权,推动产品创新和差异化,建立自主可控的产业生态。

如今国内的RISC-V生态建设正在快速推动中,从5月,上海发布国内首个明确表示支持RISC-V的政策,到9月,中国RISC-V产业联盟在上海成立,再到11月,中国开放指令生态(RISC-V)联盟在乌镇宣布成立。

产业联盟的多家企业表示,RISC-V的开源将大大降低指令集修改的门槛,有利于中国发展自主可控的处理器,摆脱国外的制约。

不过,技术的先进性不代表商业就能成功,生态问题始终是制约一个架构发展的最大瓶颈。ARM之所以能制霸移动终端,除了它在技术上的优势外,抓住时机、迅速建立起生态亦是关键。但生态建设并非一蹴而就,隐藏在生态问题背后的政策、资金、人才等多方面的压力都在制约着RISC-V在国内的发展。

要实现国产RISC-V自主可控发展,不仅要迅速行动抓住时机,还应以市场为导向,找准适合的市场定位和客户群。在真正对ARM造成威胁之前,RISC-V距离成为主流架构还有很长的路要走。

PC时代成就了英特尔x86,移动时代成就了ARM,而在科技巨头以及一大批创企对RISC-V的发展和生态建设的推动之下,或许RISC-V能够成为AI和IoT时代足以与ARM匹敌的新一代主流架构。

图片 17

相关文章

网站地图xml地图