欧宝平台登录:对话亿铸创始人:要做存算AI大算力芯片

发布时间: 2022-08-24 04:02:04 来源:欧宝体育直播nba 作者:欧宝体育手机版app直播

  AI大算力芯片是当前创业者最聚焦的领域之一,算法模型的发展、芯片架构的迭代、工艺进程的演进以及各项产业政策的出台,都在告诉世界这个领域蕴藏着巨大的产业能量和革新机会。1988年,熊大鹏在华中科技大学当老师,为了能够去美国读博,他必须申请到目标学校的全额奖学金。当时中美之间的技术交流有一道巨大的鸿沟,即便只是跨越地理阻碍,飞到了旧金山上空,也足够让他觉得振奋。在德克萨斯大学奥斯汀分校的那几年,是他芯片设计生涯的开端,为后来能率先抓住全数字存算一体架构的实现路径埋下了伏笔。严格来说,芯片最开始不是SoC(片上系统级芯片),而是主要用于电路设计板的独立功能芯片和器件。随着密度需求越来越大,行业开始慢慢升级,将电路板上的电路、器件和功能芯片,集成和微缩成专用的SoC系统芯片。在美国的这段学习期间,熊大鹏开始从之前的电路板设计进入到芯片设计领域,见证了从最原始的电路板设计、功能芯片设计,到现在大算力SoC芯片的整个行业发展进程。在美国工作近10年后,熊大鹏决定回国创业。那时的项目是一些偏简单的鼠标芯片、通讯芯片以及GPGPU、CGRA、DPU等不同架构AI芯片,近几年国内半导体芯片更新速度加快,行业格局每隔几年就会产生剧变。而这一次,他的“对手”是经典的冯·诺依曼架构。

  三道墙在AI大算力芯片领域,能效比的提升极度依赖工艺制程的演进,各类算法的应用部署高度依赖既有的GPU的软件生态。而目前在这两个维度上,英伟达兼具压倒性优势,在AI大算力公开市场的占有率近90%。抛开芯片国产替代这一层意义,一家独大的产业格局对于众多下游应用场景客户来说,是一座想离开却无法离开的城池,下游应用客户的供应链选择和议价权受限,彼此间的业务差距难以拉开。而对众多在AI算力芯片赛道的创业者来说则是一片充满挑战的蓝海。

  作为向蓝海挺进的一员,熊大鹏清楚地知道,沿英伟达的技术发展路径继续努力,理论上是有可能与其比肩的。但GPU似乎已不是AI大算力发展的技术架构路径,而所谓“充沛的时间和资源”,对于一家初创企业来说至少是10年的时间成本和数以万计的技术人才投入。

  盘了一遍不同的计算机架构后,他认为虽然当前的技术方案已将AI计算推进到了产业化和应用阶段,但都在冯·诺依曼架构的范畴,要追求更高的性能,摆在眼前的三个问题亟待解决:能耗墙、存储墙、编译墙。

  首先是能耗墙问题。占AI大算力芯片高地的英伟达GPU芯片,工艺制程从之前的7nm提升到了4nm,单位面积性能随之提升约2倍左右,但能效比可能只提升不到一倍;同时还要做巨大的软件调优投入,以实现对各主流算法的适配和部署。

  考虑到工艺本身已接近物理极限,通过提升工艺去拔高性能和能效比的方式已渐趋饱和。且当前AI对算力的需求每三到四个月就要往上翻一倍,芯片开发动辄数亿美金,投入巨大。

  在成本、能耗以及工艺制程演进滞缓等多重压力下,能耗墙越来越成为AI向更多应用场景普及的技术瓶颈之一。

  但能耗墙问题只是表象,更深层次的原因在于导致能耗墙问题出现的存储墙。熊大鹏告诉创业邦,存储墙的问题是AI芯片设计工程师面临的最具挑战的问题之一。

  原因在于这些芯片目前采用的均是从1946年被沿用至今的冯·诺依曼架构,其架构原理是将计算与存储分离。早期,冯·诺依曼架构是很好的存在,算是算、存是存,存算分离的架构,让指令集ISO设计和CPU设计变得更简洁,但AI大量数据所需要的并行计算成了它继续维持“完美架构”的“绊脚石”。

  然而一次并行处理需要同时启动几千个计算核,几千组数据全部到位后才能开始并行计算。在存算分离的架构下,数据需要在计算和存储单元之间不停地搬运,直至所有数据全部被搬运到位,才开始计算。

  所以在大规模的AI数据计算中,只要有一个数据被卡住,就会导致成千上万个计算核同时怠工,产生大量计算之外的能耗。据统计,用于数据搬运的能耗已占整体能耗的70%-90%,而数据搬运效率决定了计算效率。

  为提升数据搬运的效率和计算能效比,业内将存储设计分成一级缓存、二级缓存、三级缓存等,通过分层级管理的复杂架构来优化数据的卡壳问题,让数据离计算单元更近、带宽更大、让必须搬运的数据量更少。但这种思路使当前的存储架构变得更复杂,增加了数据存算资源分配、数据搬运和管理的复杂性,编译难度骤增, 导致第三道墙——编译墙(生态墙)出现。

  由于存储墙内这些数据是实时动态、流向未知的,且是多级动态管理的,可能被卡住的地方也是未知的,必须依赖各类工具来手动调优解决数据卡顿的问题。但在实际操作中,局部的调优往往会影响其他地方的数据流动,问题一生二、二生三,彼此掣肘,常常需要几十个人花几个月甚至更久的时间才能将数据资源的调用路径调整到相对高效的状态。

  有痛点的地方,就有机遇,“如果能解决别人解决不了的问题,那么问题反而成了最大的竞争护城河所在。”熊大鹏说道,英伟达就是通过上万软件工程师基于自有通用并行计算架构CUDA(Compute Unified Device Architecture)开展了大量手动和自动调优工作,历经十几年的积累,为自己构建了一道很高很厚的软件生态墙。

  后来者如果沿着英伟达的技术路线设计AI大算力芯片,除了需要在芯片设计及工艺制程上与其竞争之外,更需要在软件生态建设上做大量投入和积累,而这对于创业者来说是一座必须翻越的“珠穆朗玛”。

  同样,要在AI大算力赛道追赶国际芯片巨头,除了正面翻越“珠穆朗玛”这条路外,还可以找到另一条从A到B的路。

  随着新型忆阻器ReRAM(即RRAM)的成熟,将其应用于AI算力芯片这一思路越来越被业界认为是破局当前技术僵局的最佳路径之一。

  熊大鹏在2017年接触到存算一体的计算架构,并越来越坚信这是一条真正能打破冯·诺依曼架构的革命性技术路线月,熊大鹏在上海成立了亿铸科技,目前已经是一家基于ReRAM设计和落地全数字存算一体AI大算力芯片的行业领头羊企业。亿铸拥有一支顶级的研发、工程和顾问团队,致力于将ReRAM这种忆阻器以全数字的技术路线应用于存算一体AI大算力芯片领域。

  要知道,亿铸并不是第一家投身于存算一体芯片的公司,国内外已经有几家同样做存算一体架构芯片的公司。

  因此,亿铸基于对AI大算力赛道现有痛点的深度解析,巧妙地将ReRAM这种存储介质的属性优势和全数字化的路径优势进行深度整合,切实将存算一体这一先进的计算架构在AI大算力芯片赛道落地,向业界提供大算力、高精度、高能效比、易部署的AI大算力芯片产品。此外,亿铸科技已和国内先进的ReRAM IP及产能供应商昕原半导体达成紧密合作,实现双方共研联调,确保亿铸ReRAM全数字存算一体AI大算力芯片的成功量产。

  毋庸置疑,亿铸ReRAM全数字存算一体大算力芯片的出现将给业界带来全新的AI大算力解决方案,而它算力大、精度高、能效比高、部署容易的特点也将会对AI大算力的既有技术格局带来一定的冲击。

上一篇:半年 6 个管线医图生科 AI+ 生物信息学:成药性 可靶性准度 90%实现 AI 贯穿研发的 License Out
下一篇:动力企业怎么开掘数据进行数字化转型

相关信息

  • 欧宝体育手机版app直播:动力企业怎么开掘数据进行数字化转型

    欧宝体育手机版app直播:动力企业怎么开掘数据进行数字化转型

    跟着动力范畴的加快革新,国家电网公司活跃拟定施行大数据战略,树立大数据中心,开掘海量动力数据资源价值,健全数据财物办理系统,用数据驱动办理革新和转型晋级。怎么根据才智城市动力云途径获取的海量动力数据财物,运用数据开掘技能,唤醒熟睡的数据,对数据进行解构、重组、再造,清晰数据在哪里、数据有多少、数据怎么用,完成财物数据化到数据财物化的改变,优化与立异商场拓宽形式是动力企业亟待解决的问题。 现在,大数据剖析、人工智能等新式技能正在加快动力职业的数字化转型,开掘动力数据价值是加快动力职业数字化转型的重要驱动力。张江科学城10kV及以上电压等级的719家高压用户的电网侧数据规划到达TB级,但现在主要从用电保证、应收电费等方面做了开始剖析,动力结构、动力效益、动力优化等方面的数据开掘仍存在较广泛的空间,潜力巨大。 本文环绕政府、动力企业、动力客户、动力服务商场这4类方针客户展开要害要素,细分方针客户需求。 政府:期望及时掌控张江科学城范围内各职业、各区域的动力供应、动力消费、动力使用类型、动力转化功率、绿色动力配给状况,完成“以环境论英豪”、“以能耗论英豪”、“
  • 欧宝体育手机版app直播:数据办理的四个阶段

    欧宝体育手机版app直播:数据办理的四个阶段

    数据办理的界说是对数据财物办理行使权力和操控的活动调集。其终究意图是发掘数据价值,推进事务开展,完成盈余。 我国最早意识到数据办理重要性的职业是金融职业,金融职业对数据的依赖性很强,而数据办理是数据渠道建造的首要约束要素。 数据办理渠道是以元数据为根底,完成数据的发生、存储、搬迁、运用、归档、毁掉等环节的数据生命周期办理。完成数据从源到数据中心再到运用端的全过程办理,为用户供给了精确快捷的企业财物信息。数据办理渠道也包含数据规范,数据质量。 第一阶段,整理企业信息,构建企业的数据财物库。首先要清楚企业的数据模型、数据联系,对企业财物构成事务视图、技能视图等针对不同用户视角的展现。 第二阶段,树立办理流程,落地数据规范,提高数据质量。从企业视点整理质量问题,紧抓规范落地。 第三阶段,直接为用户供给价值。本阶段依赖于前两个阶段的建造,为用户供给方便的获取数据的途径。 第四阶段,为企业供给数据价值。经过多种手段对多种来历的数据进行剖析,构成企业常识图谱,表现数据的深层价值。 经过这4个阶段的建造,树立起全企业的数据质量
  • 欧宝体育手机版app直播:发掘出行数据巨大潜力的四步法

    欧宝体育手机版app直播:发掘出行数据巨大潜力的四步法

    还需求政府、企业和顾客权益建议者一同努力,树立合理且互相赞同的数据同享实践 同享单车、拼车、P2P同享轿车,移动出行服务的增加众所周知,但相同能改动游戏规则却不易被人发觉的,是与之相伴的移动数据搜集的爆破式增加。 根据APP的移动服务使私家公司能够搜集到史无前例的巨大信息,包括咱们在何时、何地、怎么出行,以及人们为此支付了多少钱。相关企业正是运用这些信息来扩展服务和进步赢利。 麦肯锡咨询公司陈述显现,尽管到2030年,来自于全球私家车的数据价值将到达4500亿至7500亿美元,但将轿车数据货币化仍是一个严峻应战。 即便是如此高的估值还或许是被轻视的状况。这是由于麦肯锡只重视了信息娱乐和广告的或许性,而没有将移动数据怎么支撑城市基础设施的出资考虑进去。 金融和保险业巨子AIG着重,咱们的现代经济“依赖于企业和个人同享数据的志愿”。但问题在于,大多数出行数据仍被锁定在各家私营企业内部,也没有想出怎么以一种可行的办法将其同享化。 Lyft和Uber等叫车公司一直在与监管组织就哪些数据同享要求是合理的打开奋斗,而由政府运营的公共交
  • 欧宝体育手机版app直播:寒武纪小讲堂(九)大数据处理的四步

    欧宝体育手机版app直播:寒武纪小讲堂(九)大数据处理的四步

    大数据处理进程首要包含以下四个进程:搜集、导入(预处理)、核算(剖析)和发掘。 大数据搜集是指运用多个数据库来接纳从客户端发送的数据,用户能够运用这些数据库进行简略的查询和处理工作。 在搜集大数据的进程中,其首要特色和应战是高并发性,由于或许稀有千个用户一起拜访和操作,因而需要在搜集端布置很多数据库来支撑。 尽管收集端本身将具有许多数据库,但假如要有效地剖析这些海量数据,则应将这些数据从前端导入会集的大型分布式数据库或分布式存储集群,而且能够进行一些简略的整理和预处理。 核算和剖析首要运用分布式数据库或分布式核算集群对存储在其间的海量数据进行一般剖析和分类及汇总,以满意大多数常见的剖析要求。 与之前的核算和剖析进程不同,数据发掘一般没有预先设定的主题,首要根据现稀有据。各种算法的核算,然后起到Predict的效果,完结一些高层次的数据剖析需求。 寒武纪数据2015年在青岛组成技能研制团队。历经三年科技攻关,先后完结了智能商网体系的开发,数据管理体系的开发、智能引荐体系的开发,智能数据感应体系的开发,程序化广告智能投进体系的

手机扫一扫添加微信