你的位置:r18动漫 > 影院 >

麻豆 艾鲤 国内光子狡计新突破!大家首度救济商用AI算法,能跑大模子,纯真可编程,集成数暴增


发布日期:2025-03-26 21:37    点击次数:95

麻豆 艾鲤 国内光子狡计新突破!大家首度救济商用AI算法,能跑大模子,纯真可编程,集成数暴增

芯东西(公众号:aichip001)麻豆 艾鲤

作家 |  ZeR0

剪辑 |  漠影

飙涨的算力需求,正拉开数据中心基础设施升级的大幕。硅光时期的优厚性日益突显,从远距离的光通讯到芯片里的光狡计掀翻时期改进。

芯东西3月25日报说念,本日,大家光子狡计赛说念融资限度最高的公司之一曦智科技,发布全新可编程光电混总狡计卡——天枢。

这是大家首个救济商用AI算法的光电混总狡计居品,在救济科学狡计(如伊辛算法)的基础上,加强了对ResNet-50等算法应用的救济,并可救济启动Llama算法,DeepSeek最近也正在调试。

天枢聘用3D先进封装时期,其中枢由光学处理单元(OPU)和专用集成电路(ASIC)构成,单芯单方面积、器件集成数均大幅升迁。

比较日渐迫临物理极限的传统电子芯片,光电混总狡计芯片具备高通量、高能效比、超低蔓延等上风。

上一代光子狡计处理器PACE包含64×64光学矩阵,而天枢将矩阵限度扩大4倍至128×128,单芯单方面积扩大到600mm²,主频1GHz,可应用于深度学习、图像处理、科学狡计等场景。

其一大亮点在于可编程性。用户可通过API纯真配置光子狡计矩阵的整个,从而启动更多定制化算法,骄横万般化的狡计需求。

天枢还凭借PCIe Gen4 x 16高速接口,好意思满了与现存狡计机系统的无缝集成和高效扩张,以便光子狡计时期大概愈加方便地融入各样高性能狡计环境。

这些本性使得天枢成为光子狡计在复杂多变场景下新应用探索的可靠平台。

在曦智科技上海办公室,芯东西与曦智科技创始东说念主兼CEO沈亦晨博士、曦智科技连合创始东说念主兼CTO孟怀宇博士、曦智科技COO王泷进行深远同样。

此前光狡计常被刻画为比电狡计快10000倍,但在落地中要好意思满精度与速率的均衡,确凿数据远够不上这样夸张。

据沈亦晨明白,曦智科技的盘算是让光狡计尽快在营业场景中可用,好意思满比电狡计3-5倍性价比升迁,其光电混总狡计芯片已处于可量产情景,接近平直可插拔到现存处事器中。

现在,曦智科技在供应链上已好意思满国产自主可控。

曦智科技运筹帷幄到2027年,将下一代超大限度高频光电羼杂芯片升级到256×256光学矩阵,瞻望2026年年底出样片、2027年发布。

沈亦晨坦言现存光电混总狡计卡启动大模子的速率还不是很快,下一代将提供更大的存储带宽和容量。曦智科技另一条光子收罗居品线的最大上风等于升迁带宽,运筹帷幄将片上互连和片间互连时期应用到下一代居品中。

下一代瞻望好多颗光狡计芯片和存储芯片将通过光互连方式链接,在大模子推理上施展上风。

一、对准低蔓延场景,施展光狡计上风,往后发展大模子推理

2017年6月,沈亦晨博士行为第一作家和通讯作家的论文发表于外洋学术顶级期刊《当然·光子》封面。这一接头独创性地建议了光子AI狡计新旅途,眩惑了十几家初创公司接踵确立。

曦智科技是沈亦晨在2017年博士毕业后确立的第一家公司,中枢成员由来自麻省理工学院的顶尖科学家和领有丰富半导体行业教导的业界闻明东说念主士构成,如今已发展成大家光电羼杂赛说念的居品进展、时期研发领跑者,在上海、杭州、南京、北京、新加坡等地均设有办公室及实验室。

刻下曦智科技领有近250东说念主的团队,估值业界起初。

孟怀宇告诉芯东西,光电混总狡计的时期旨趣决定它在通用性上与CPU、GPU等传统通用芯片存在差距,光器件不成作念得比波长小太多。沈亦晨补充说,考虑到能不息缩减的空间有限,升迁器件密度,可能更多利用主频和光分复用的设施去优化的空间更大。

沈亦晨讲授说,光电羼杂芯片的市集定位与GPU不同,对准的是对低蔓延有高需求的应用场景,不错跑出电芯片跑不出的效力,还有一些早期客户偏向产教研实验接头,往后发展可能会更聚焦大模子推理倡导。

在大模子适配方面,曦智科技将在体现光狡计上风的情况下,尽可能扩大通用性,押注于以矩阵乘法为中枢的主流Transformer架构,不息沿用高带宽,用光作念矩阵乘法,电芯片通过引入RISC-V等方式,引入更通用的算子。

现在其行业应用案例包括EDA、量化往来、银行安全等麻豆 艾鲤,比如用于优化光电羼杂芯片EDA经过中的应用、在风险价值计量中的应用、在银行账户讹诈识别中的应用。

以前曦智科技光狡计居品将落地于药物发现、基因工程、金融工程、图像识别、医疗影像分析、工业遐想等应用场景。

二、光电混总狡计通用性令东说念主惊喜,优化要点是升迁精度

大数据越来越大的比例是在作念线性运算,曦智科技则发明了一种用光高效作念线性狡计的方式。

光在非均匀介质中传播和散射时,其形态肖似于某种风景的数学线性运算。曦智科技利用光实践向量矩阵算法,当光插足系统时,它会被一组光学调制器编码以酿成输入光向量,然后插足可编程光学散射介质的区域,输入光向量经过矩阵后,输出光向量当然就代表了矩阵乘法的扫尾。

由于矩阵乘法自己是被迫的,这个过程中不会花费能量,且蔓延很低,终末高能效和低时延性能与输入光信号的频率无关,这就意味着光矩阵不错救济高通量。

2019年4月,曦智科技推出大家首款光子芯片原型板卡,启动神经收罗模子来识别手写数字图像,用时唯一其时起初进电子芯片的不到1%。

但这远未施展出硅光时期的后劲,要将其表面上风变为实践,一个错误的法子是将多量的光子和电子器件集成在通盘。2021年12月,曦智科技推出光子狡计处理器PACE,将单芯片集成的光子器件数目提高到卓绝10000个,启动1GHz系统时钟,在贬责伊辛问题(Ising)和最大割/最小割问题(Max-cut/Min-cut)时,PACE的运算速率可达其时高端GPU的数百倍。

北京大学接头员常林共享了对曦智科技第一代居品的感受,以为对其能处理问题的通用性感到惊喜,远超他们的预期。

自动驾驶需要借助光时期来好意思满精特务测,其团队将曦智光电加快卡应用于雷达成像,大概处理限度为5000 x 5000阁下的复数矩阵,精度达到8bit,70%以上的运算在曦智科技光子狡计评估板Gazelle上好意思满。

他期待更大限度的光学狡计硬件,进一步升迁精度和纠错软硬优化算法,并提供更好的软件救济,包括封装好的conv、linear等常见API接口。

三、天枢三大错误时期升迁:引入3D先进封装工艺,升迁光电集成度和可编程性

今天,天枢在处理器上进一步升级,聘用了将OPU与ASIC上风组合的光电羼杂处理器,引入Flip-chip + TSV先进封装工艺,将矩阵限度增至128×128,深度会通光与电、硬件与软件上风,好意思满了光电集成度、光学矩阵限度、精度、可编程性等方面的升迁。

天枢的错误时期升迁总体分三个方面:光狡计精度、硬件、软件。

1、光狡计精度升迁

比较上一代光子狡计处理器PACE,天枢聘用的光电羼杂处理器优化了向量调制解调器的遐想,主频为1GHz,向量升迁到uint4,权重精度救济int4,输出精度升迁到8bit。

这带来的克己是,增强了天枢处理复杂数据和大限度运算的才气,并显耀提高了狡计扫尾的准确性和可靠性,减少了量化误差,大概骄横刻下主流AI模子的推理需求。

2、光电羼杂芯片+3D先进封装

天枢聘用的OPU+ASIC光电羼杂处理器,由光芯片中枢(PIC)和电芯片中枢(EIC)构成,聘用被迫散热方式,热遐想功耗为50W(包含内置激光器)。

光芯片更多贯串线性狡计和数据收罗等主要任务,由电芯片发出教唆以及与客户交互,使处理器能与现存市集软件环境兼容。

光芯片中枢包含光学张量处理单元,救济INT4/UINT4输入精度、时延为200ps,峰值算力达到32TOPS。电芯片中枢包含电张量加快狡计单元和光狡计限度单元,峰值算力同样达到32TOPS。

通过将ASIC的并行狡计才气与OPU的光处理本性相衔尾,这种遐想极大提高了处理效力,不仅突破了传统电子处理器在速率和能耗方面的局限,还显耀升迁了光狡计的精度。

同期,天枢独创性地好意思满了TSV(硅通孔)+FlipChip(倒装芯片)的光电羼杂3D先进封装,是曦智科技在光电混总狡计时期应用的又一要紧突破。据孟怀宇博士共享,曦智科技将光芯片打薄到100μm以下,通过将电芯片与光芯片3D堆叠,如图将光芯片打孔,就不错从基板垂直的有电信号去供电。

Flip-chip通过平直将芯片的有源面朝下安设在基板或另一芯片上,极大提高了光电芯片间的互连密度,减少了互连线长度,从而虚拟信号蔓延并增强数据传输速率。

TSV时期行为3D集成和系统级封装的错误构成部分,主要贬责了传统封装中常见的IR drop(电压降)问题。该时期可显耀镌汰电流旅途,虚拟传输延时;减少电阻和电感,进而虚拟电压,升迁散热才气,确保电源更踏实、更有用地供应到芯片的各个部分,提高光电芯片的互连密度,省俭芯单方面积。

此外,TSV还大幅提高了PCIe等高速信号接口的信号完好性(SI)性能,减少了信号衰减和串扰,使得数据传输愈加准确可靠。

3、软件:提供丰富算子,加快方便部署

户外sex

曦智光电混总狡计算子库包含RVV(RISC-V Vector)算子、电矩阵(dMAC)加快算子、光矩阵(oMAC)加快算子,救济狡计机视觉类、大说话模子类模子。用户借助曦智编译器,不错纯真地哄骗这些算子来构建高效的应用模子。

其平台还救济用户自界说算子,通过OpenCL C/C++说话进行编译和优化,进一步扩张了算法开发的纯真性。

曦智科技的软件栈与PyTorch、ONNX等主流框架深度集成。客户以通过软件栈平直使用天枢的光矩阵和电矩阵加快单元,对模子和算法进行加快和考据,也不错将模子通过曦智编译框架编译部署在端侧进行推理。

曦智光子狡计模拟器是软件栈中的一大亮点,为用户提供了方便的光狡计单元构建与仿真模拟功能,大概显耀加快用户在光狡计平台上的算法探索与考据过程,助力科研与应用的快速鼓动。

曦智科技还将积极鼓动光狡计开发者生态开发,通过专项基金栽种以前行业东说念主才,与高校及接头机构建立合营伙伴联系,以及鼓动数百万级别的合营面容。

四、两大居品线,三大中枢时期

针对以前狡计范式的大趋势,曦智科技以光子矩阵狡计(oMAC)、片上光收罗(oNOC)、片间光收罗(oNET)三大中枢时期开赴,打造光子狡计和光子收罗两大居品线,建立围绕软硬件、开发者、产业三大生态的完好光电混划算力腾达态。

光子狡计居品线利用光子矩阵狡计及光子收罗的时期上风,为客户在特定使用场景下,提供定制化的贬责决策,好意思满高算力、低延时的优厚性能。主要居品有:可编程光电混总狡计卡天枢、光子狡计处理器PACE、AI推理卡OptiHummingbird、光子狡计评估板Gazelle。

光子收罗居品线利用曦智自研集成光子时期,为客户提供卡间(B2B)、处事时候(S2S)、机架间(R2R)等多层级的互连贬责决策模块,好意思满大限度数据中心的性能扩张,主要居品包括其首款适用PCIe和CXL契约的数据中心狡计光互连硬件居品Photowave系列。

还有集成激光光源居品Moonstone,具有微型化、高功率、低功耗、单/多波长等特质,可好意思满多至8个通说念波长的光输出,救济曦智科技通盘居品系列,也不错为第三方应用提供激光光源贬责决策。

曦智科技的三大中枢时期如下:

oMAC(Optical Multiply Accumulate)光子矩阵狡计是一种用光子替代传统电子进行数据处理的模拟狡计,可显耀升迁单节点内算力。它通过光的强度或相位模拟数字信号,在光信号通过光学矩阵的同期完成狡计,不花费相当的能量。

oMAC实践的线性运算亦可会通为矩阵-矩阵或矩阵-向量之间的乘法,时期上风有:1)光狡计并行才气更强;2)能效失色以致更优于电狡计;3)光子狡计蔓延超低;4)硅光对工艺制程和本钱条目较低。

oNOC(Optical Network on Chip)片上光收罗是一种单节点内的互连时期,通过用光波导代替铜导线的方式,让数据在光芯片收罗中传递,可好意思满单个电芯片(EIC)内不同单元间的高速数据传输,及团结封装里面多个电芯片之间的高速数据通讯。

其时期上风包括:1)高带宽、奸巧耗、低蔓延、距离不敏锐;2)通用性强,可好意思满不同类型电子芯片间高速、奸巧耗的互连,有用扩大芯单方面积,升迁单节点性能;3)适用于任何有高带宽需求的应用场景,使狡计架构遐想更纯真,好意思满更复杂的拓扑结构,优化升迁系统利用率。

oNET(Optical inter-chip Networking)片间光收罗是一种多节点间的光互连时期,使光芯片起到肖似optical BUS的作用,将团结单元里面需要传输的数据集中起来,通过光传播介质(如光纤)与其他单元进行数据交互。

该时期的上风有:1)高带宽,低蔓延,高能效比,有用升迁数据中心内不同狡计硬件的职责负载效力;2)对传输距离不敏锐,赋能可重构解耦架构数据中心的资源池化和横向扩张。

曦智科技独创性的光电混划算力范式将推动电子芯片遐想、软件开发、封装等各关节走向新的时期前沿。

在电子遐想范围,提供起初的模拟遐想、数字遐想时期,超高速的互连时期,高速高精度的数模治疗时期,以及与硅光的超高密度的共封集成时期。

在3D封装时期倡导,集成硅光芯片与电子芯片需以3D封装风景堆叠而成,从而保证两者无缝协同运作。

在激光器微型化时期倡导,通过自研时期,将外置激光器微型化,最终好意思满激光器在板卡上的集成封装,有用虚拟本钱和踏实性。

结语:突破晶体管放胆,光+电是以前的谜底

插足算力需求爆发的期间,传统电子芯片晶体管微缩接近物理极限,算力供应日渐前门去虎,前门拒虎,功率、通讯、内存探访等方面王人成为放胆算力扩张的瓶颈。

有用的时期贬责决策包括通过存算一体减少存储和狡计之间的数据搬运、冲破“内存墙”,或是通过专用架构、把芯片晶体管进行重新罗列、针对场景深度优化,以提高狡计利用率,这两种方式贬责的是存储带宽和晶体管使用效力问题,但并不成从根底上贬责晶体管数目放胆或完全算力的问题。

囿于铜导线有电阻,在铜导线上的数据搬运会产生热量。跟着摩尔定律放缓、登纳德缩放比例失效(集成度升迁遭遇功耗和散热瓶颈,“功耗墙”问题阻拦晶体管密度握续升迁),曦智科技团队认为,光+电会是以前的谜底。

光电混总狡计是一种更偏底层时期的革命,和电芯片一样不错作念近存狡计或流式狡计。光狡计可通过提高主频,或者波分复用的波长数目,来进一步加多单元面积的完全算力升迁。

光电混总狡计有望突破晶体管放胆,贬责单元面积的完全算力,不管多大主频,王人不会产生热量。刻下光子时期无法完全取代电子时期,电芯片提供存储单元,更擅长高精度和非线性运算。

沈亦晨博士强调说麻豆 艾鲤,光子狡计时期刻下不错贬责部分矩阵狡计,暂时还莫得贬责用光来作念高速读取存储功能或一些高精度逻辑算法,这些部分仍需用电子芯片来好意思满。



友情链接: