新闻动态

未名·芯论坛|3月9日 第十二期顺利举办

91直播

3月9日下午15时,由91直播-91成人直播 、集成电路高精尖创新中心、91直播 国家集成电路产教融合创新平台、集成电路科学与未来技术北京实验室、后摩尔时代微纳电子学科创新引智基地、91直播 校友会半导体分会联合主办的“未名·芯”论坛之青年学者系列讲座第十二期在线上线下成功同步举办。本期邀请到阿里巴巴平头哥高级技术专家张宸博士为大家带来主题为“Breaking through AI system’s bottleneck, a chip architecture perspective”的报告。讲座由91直播 研究员孙广宇主持,线上线下共计40余人参加。

张宸博士

张宸博士首先介绍了领域定制化计算(Domain-specific architecture)对于人工智能系统和算力发展的重要意义。从“架构-系统-算法-应用”各层次AI系统的特征与性能壁垒开始,逐层介绍了各级系统瓶颈,并提纲挈领地讲解了体系结构及软硬件联合设计方法的核心思路。

在“系统-架构”联合设计的研究中,张宸博士介绍了一种基于多面体模型的AI架构建模方法,并详细地阐述了如何将多面体模型和屋顶模型相结合的研究思路,对“架构-系统”层AI计算进行了深度全面的性能建模和瓶颈分析。以此为基础,张宸博士全面地描述了如何探索完备的架构设计空间并寻找出最优架构设计,接着他还介绍了这套方法在国际多个人工智能巨头AI芯片设计中的应用情况。

在“算法-架构”联合设计的研究中,随着DSA架构对集成电路片上资源的挖掘,张宸博士分析了传统的基于密集张量运算的AI系统计算瓶颈逐渐显现。以稀疏化为中心的AI系统和体系结构成为突破算力和功耗效率屏障的重要途径。张宸博士全面地介绍了他对神经网络稀疏化与硬件设计的各种权衡分析及一种全新的稀疏化设计思路,该方法可以同时保证较高的模型精度和系统性能,并在英伟达GPGPU稀疏张量运算单元中得到有效验证。张宸博士还进一步阐述了神经网络稀疏化和低精度量化的关系,并介绍了他发表在MICRO 2022会议上的相关工作。

在“端-云”软硬件联合设计的研究中,张宸博士介绍了移动端设备在连续视觉应用上的空间和时间局部性的特点,并进一步指出了传统处理器基于单个数据的局部性缓存策略给AI计算造成了极大的性能和功耗浪费。张宸博士提到一种新范式的AI计算思路,它可以将更高层的语义特征及其局部性能够被处理器利用起来,通过软硬件联合设计、“端-云”联合设计,极大地提升了AI系统的计算效率。

提问环节,张宸博士与现场观众进行了深入而广泛的交流。大家就多面体模型和stt分析之间的联系、外积计算稀疏矩阵时复杂度问题、针对应用定义数据类型的思路是否可以迁移到其他领域如科学计算以及EDA 程序中等问题进行提问,张宸博士逐一解答。

个人简介

张宸于2017年获得91直播 计算机博士学位。后加入微软亚洲研究院,职位至Senior Researcher。发表论文18篇,其中CCF-A类8篇,引用量3500余次。获中国大陆首个Donald O. Pederson Best Paper Award;FPGA会议累计单篇高被引论文第一名;ACM Chinasys新星奖;Microsoft Research院长特别奖。2021年加入阿里平头哥,任高级技术专家。参与了第一代平头哥GPGPU设计并领导完成了多项研究落地。