自动化所推出首款低比特量化神经处理芯片

3月21日,中国科学院自动化研究所南京人工智能芯片创新研究院(简称“AiRiA研究院”)“普惠AI,芯向边缘”战略发布会在京举行。会上宣布,AiRiA研究院自主设计的量化神经处理器将于今年底流片。

AiRiA研究院于2017年9月成立于南京市江宁区麒麟高新区,依托中国科学院自动化研究所,主打人工智能和芯片关键技术研发和技术推广。

AiRiA研究院相关负责人表示,随着物联网的发展、5G商用的迫近,各大计算厂商、云业务服务商纷纷布局边缘计算。量化技术并非AiRiA研究院所独有,但其在量化精度上可达到3比特甚至更低。

“我们是AI芯片的后来者,但我们结合自身优势和选择发展前景最好的边缘计算方向。从这里切进去,一方面源于我们对市场的研判,一方面我们有10多年的技术积累来支撑我们的判断。”程健对《中国科学报》说道。

该量化神经处理器定名为“Watt
A1”,是首款主打低比特量化技术的人工智能芯片,将采用台积电28nm制程工艺,峰值算力达24Tops(表征每秒整数操作次数,单位为万亿次每秒),支持1080P四路实时监测,帧效比可达6Tops/W。Watt的定位是面向边缘计算的AI芯片,能够在功耗、成本等受限情况下保持高性能。同时可做到在片上处理大规模神经网络,避免了芯片计算领域的“内存墙”难题:数据计算在片内处理,不必反复访问外部存储器,可极大减少芯片自身功耗,大幅提高推理速度。因而,适合边缘计算对“低功耗、低时延”的计算场景。

AiRiA研究院副院长冷聪向《中国科学报》补充说,量化技术并非AiRiA研究院所独有,但在量化精度上达到3比特甚至更低是其他团队难以比拟的优势,“8比特已经很不错了,但是我们能做到3比特、2比特甚至1比特。”

AiRiA研究院于2017年9月在南京市江宁区麒麟高新区成立,依托自动化所,致力于人工智能和芯片关键技术研发和技术推广。

随着物联网的繁荣及5G商用的迫近,边缘计算越来越成为热门,大有与中心计算平分秋色之势。各大计算厂商、云业务服务商也纷纷面向边缘计算布局。

如此一来,程健表示,功耗和成本都保持很低,计算能力依然保持较高,因此QNPU非常适合边缘计算对“低功耗、低时延”的计算场景。

发表评论

电子邮件地址不会被公开。 必填项已用*标注