CC读书 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

在当下人工智能飞速发展的时代,芯片就如同AI的“心脏”,为各种智能应用提供着不可或缺的算力支持。华为的昇腾芯片,作为国产AI芯片的杰出代表,备受瞩目。今天,咱们就用最通俗易懂的大白话,来深入了解一下昇腾芯片到底是怎么一回事。

一、昇腾芯片诞生的背景

这几年,人工智能火得一塌糊涂,到处都在搞AI大模型,像chatGpt这类的应用更是让大家看到了AI的巨大潜力。AI大模型的训练和各种AI应用的落地,都需要巨量的计算能力,这就离不开AI芯片。

以前,在AI芯片领域,英伟达的GpU那是占据着主导地位。但是呢,由于众所周知的原因,英伟达的GpU对我们进行了禁售,连阉割版的h20都不卖给我们了。这就好比做饭突然没了锅,AI发展面临着算力短缺的困境。就在这个时候,华为的昇腾芯片挺身而出,成为了国产AI芯片的希望之光,发挥了重要的替代作用,也迎来了巨大的市场机遇。

二、昇腾芯片的家族成员

昇腾芯片是一个庞大的系列,主要包括昇腾310和昇腾910两个子系列 ,它们有着各自不同的特点和用途。

(一)昇腾310:小巧灵活的边缘“助手”

昇腾310是Soc小芯片,就跟我们手机芯片差不多大,只有指甲盖那么点儿大 ,功耗也特别低,仅有8w,特别省电。它麻雀虽小,五脏俱全,集成了多个运算单元,包括8个ARm A55 core的cpU、AI core、数字视觉预处理子系统等。

它主要面向边缘计算与低功耗终端,就像是一个灵活的小助手,在边缘端帮助完成AI推理任务。比如说,在智能安防摄像头里,昇腾310就能实时对采集到的视频图像进行分析,看看有没有异常行为,而且因为它功耗低,摄像头也不用担心太费电。它的AI core采用了华为自研的达芬奇架构,就像一个高效的计算小能手,能够复杂执行矩阵、向量、标量计算的算子任务,而cpU则负责非矩阵类复杂计算。根据海思官网的披露,昇腾310的Fp16算力为8topS,INt8算力为16topS,采用12nm工艺制造。

(二)昇腾910:云端的强大“算力担当”

昇腾910可就大多了,和我们的掌心差不多大 ,功耗在300w以上 ,是个“大力士”,主要面向云端高性能计算。它的算力特别强,既能用于AI推理任务,也能用于AI训练任务,是云端的“算力担当”。

华为早期发布的昇腾910,其实应该算是910A 。当时华为还没被完全禁售,所以910A采用了台积电的7nm增强版EUV工艺 。芯片内建了32颗达芬奇max核心(达芬奇核心分为max\/Lite\/tiny三种,max最完整),支持混合精度计算(Fp16\/Fp32\/INt8),Fp16算力为256tFops,最大功耗350w(一开始说是350w,后来变成了310w )。

2020年华为被列入实体清单后,台积电那边的先进工艺用不了了。于是,华为就与中芯国际(SmIc)合作,采用他们的N+1工艺(等效7nm),推出了910b 。910b优化了架构设计,提升了能效比,芯片尺寸为21.32mmx31.22mm,Fp16算力约320tFLopS,INt8算力约640topS 。显存为64Gb hbm2e,显存带宽400Gb\/s 。910b也分为b1\/b2\/b3 。910b3引入了hbm3e内存,带宽提升至1.2tb\/s,支持万亿参数模型训练。

最近这两年,华为又推出了昇腾910c 。昇腾910c采用中芯国际的7nm(N+2)工艺,晶体管数量达到530亿 。910c采用了类似b200的双die封装设计,就是把两颗独立的芯片die分别放置在各自的中介层,再通过有机基板将两个中介层连接起来 。通过把两颗昇腾910b整合到一起,实现了性能的提升。这种封装方式虽然在芯片间互联带宽上可能低于英伟达的先进封装方案,但好处是成本更低、良率更高,量产速度也更快。

业界估测,910c在Fp16精度下的单卡算力能达到800tFLopS左右,大概是英伟达h100芯片(2022年推出)的80% 。不过,910c的芯片逻辑面积大约比h100多60% 。这也意味着910c在架构效率和设计优化方面,和h100还是存在一定差距的。910c的hbm高带宽内存仍然来自海外厂商(国内dRAm制造商长鑫存储hbm2e相关技术还需要再等等),但芯片的整体国产化比例据说已经达到90%以上 。

关于910c的消息比较神秘,根据网络上不太确定的信息,910c于2024年四季度推出样片,2025年一季度开始量产,目前已经处于大规模出货阶段,全年销量大概在70 - 80万颗 。也有消息说,2024年910b的出货量约四十万张,今年910b出货量可能与去年持平或略低(约30万张),而910c的出货量预计可能超过40万张 。因此,华为今年910b + 910c的整体出货量可能是70 - 100万张 。出货量和产能也有很大关系,中芯国际N+2工艺良率去年只有20%,今年据说已经达到40 - 50% ,分配给910c的产能貌似是2.6万片晶圆\/月(数据不太确定,仅供参考)。价格方面,910b的均价据说大约是11万\/片,910c可能是18 - 20万\/片 。网上很多文章说910c价格是1800美元,感觉不太靠谱。相比之下,英伟达h100的市场价格,大约是2.5 - 3万美元\/张 。

对了,华为前段时间推出的cloudmatrix 384超节点,由384颗昇腾910c芯片构建,系统性能比英伟达的Gb200 NVL72更强 。这就像是“群殴”模式,虽然单芯片的性能比不过人家,但通过系统层面的创新,组成更大规模的集群,也能在一定程度上弥补差距,满足算力需求。

在连接方面,华为自研的hccS高速互连接口也很厉害。昇腾910集成了hccS、pcIe 4.0和RocE v2接口,可以灵活高效地实现横向扩展和纵向扩展 。hccS对标的是英伟达的NVLINK,能够给内核、设备、集群提供系统内存的一致访问 。在单一链路的单向\/双向互联带宽上,hccS有显着优势,可以有效提升多个Al芯片协同训练的能力。

据说910c之后,还有910d ,采用5nm制程,4die封装,支持Fp8 。今年5 - 6月份回片,预期2026q2 - q3大规模量产。不过这个消息来源不太可靠,只能仅供参考。再往后,华为可能就会推出昇腾920系列,采用下一代工艺,更先进制程,努力缩小和英伟达的差距。

除了昇腾310和910之外,华为其实还有昇腾610 。昇腾610也称为mdc610,是智能驾驶芯片,用于华为自己的智能驾驶平台(mdc) 。根据资料显示,昇腾610采用了7nm制程,AI算力达到200topS@INt8或100tFLopS@Fp16 ,目前已经实现量产。

三、昇腾芯片的架构奥秘

华为昇腾芯片采用了自家独特的达芬奇架构,这可是昇腾芯片的核心技术之一,就像是给芯片赋予了一颗超级“智慧大脑” 。

这个架构专为人工智能计算设计,具有超高的计算能效比。咱们以昇腾910为例,它强大的算力能够满足大规模深度学习计算的需求 。在处理矩阵运算等人工智能常见计算任务时,达芬奇架构就展现出了极高的效率。比如说,在训练一个超大规模的图像识别模型时,需要处理海量的图像数据和复杂的计算,昇腾910凭借着达芬奇架构,能够快速地完成这些矩阵运算,大大缩短了模型训练的时间。

昇腾芯片还具备先进的张量处理单元(tpU) ,这就像是一个专门为神经网络计算打造的“加速引擎” 。它能够加速神经网络中的张量计算,让模型训练和推理的速度大幅提升 。在图像识别任务中,昇腾芯片可以快速处理大量的图像数据,准确识别出目标物体,这主要就得益于其高效的架构设计和强大的计算核心,以及tpU的加速作用。

而且,昇腾芯片在内存子系统等方面也有创新。就拿昇腾950系列来说,它将内存访问颗粒度从512字节减少到128字节 ,实现更精细的内存访问控制,大幅提升了对离散、不连续内存访问场景的支持能力 。配合华为自研的两种hbm内存技术,形成了完整的场景化内存解决方案。

hibL 1.0低成本hbm(昇腾950pR搭载) :在保证128Gb容量和1.6tb\/s带宽的基础上,通过材料与封装工艺创新,将推理prefill阶段和推荐业务的硬件投资成本降低40%以上 ,解决了大规模部署的经济性瓶颈。这就好比以前买一台设备要花很多钱,现在通过技术创新,用更少的钱就能达到差不多的效果,让更多企业用得起。

hiZq 2.0高性能hbm(昇腾950dt搭载) :实现144Gb超大内存容量和4tb\/s带宽,配合2tb\/s的互联带宽,满足大模型训练和长文本推理对高访存带宽的严苛需求 ,为千亿参数模型训练提供了充足的内存支撑。比如在训练一个超大型的语言模型时,需要大量的内存来存储和处理数据,hiZq 2.0高性能hbm就能很好地满足这种需求,保证模型训练的顺利进行。

在精度支持方面,昇腾950系列全面覆盖Fp8\/mxFp8\/mxFp4等业界标准低数值精度格式 ,同时引入华为自研的hiF8精度模式 。在保持Fp8计算效率的同时,精度接近Fp16 ,有效解决了低精度计算中的精度损失问题 ,使推理结果准确性提升15% - 20% 。这种多精度支持能力使其能灵活适配从图像识别到自动驾驶等不同精度需求的AI场景。比如在自动驾驶场景中,对精度要求就非常高,hiF8精度模式就能在保证计算效率的同时,提高识别的准确性,保障行车安全。

四、基于昇腾芯片的硬件体系

基于昇腾芯片,华为开发了一系列丰富的硬件产品,就像是搭建了一个完整的AI算力“王国”,这些硬件覆盖了边缘推理、云端推理、云端训练三大场景 ,可以满足不同行业用户各种各样的AI计算需求。

(一)Atlas 200I dK A2:开发者的得力“小助手”

Atlas 200I dK A2是面向开发者的高性能AI开发套件 ,它集成了昇腾310芯片,内置2个Al core ,可支持128位宽的LpddR4x ,最大算力为22topS 。对于开发者来说,它就像是一个得力的小助手,方便开发者快速上手进行AI开发。比如说,一些想要开发智能安防应用的开发者,就可以利用Atlas 200I dK A2,快速搭建起一个简单的图像分析系统,进行算法测试和功能验证。

(二)Atlas 300t训练卡:云端训练的“加速引擎”

Atlas 300t训练卡基于昇腾910芯片 ,集成32个达芬奇AI核 + 16个taiShan核 ,能够提供280tFLopS Fp16的算力 。在云端训练场景中,它就像是一个强大的“加速引擎” 。当企业需要训练大规模的深度学习模型时,Atlas 300t训练卡就能发挥它的强大算力,快速完成模型训练,大大提高了训练效率,节省了时间成本。

(三)cloudmatrix 384超节点:集群算力的“超级战舰”

前面提到的cloudmatrix 384超节点,由384颗昇腾910c芯片构建 ,系统性能比英伟达的Gb200 NVL72更强 。它就像是一艘“超级战舰”,在集群算力方面展现出了强大的实力。通过将众多昇腾芯片组合在一起,形成了一个超级强大的计算集群,能够满足那些对算力要求极高的大型企业和科研机构的需求,比如进行超大规模的气象预测模型训练、基因数据分析等。

五、昇腾芯片的应用领域

昇腾芯片凭借其强大的算力和灵活的适应性,在众多领域都得到了广泛的应用,就像是一把万能钥匙,打开了各行各业智能化升级的大门。

(一)智能安防:守护安全的“智能卫士”

在智能安防领域,昇腾芯片就像是一位不知疲倦的“智能卫士” 。昇腾310芯片被广泛应用于智能安防摄像头中,它可以实时对采集到的视频图像进行分析,识别出人员的行为、动作,判断是否有异常情况发生,比如有人闯入禁区、发生打架斗殴等。而且还能进行车牌识别、人脸识别等,帮助警方快速追踪嫌疑人,提高城市的安全防范水平。

(二)智能驾驶:未来出行的“智慧大脑”

在智能驾驶领域,昇腾610芯片作为华为智能驾驶平台(mdc)的重要组成部分 ,就像是智能汽车的“智慧大脑” 。它能够实时处理来自汽车传感器的大量数据,包括摄像头拍摄的图像、雷达检测到的距离信息等,通过对这些数据的分析和处理,实现自动驾驶的各种功能,比如自动泊车、自适应巡航、车道保持等,为未来的智能出行提供了有力的支持。

(三)智慧城市:城市管理的“智能中枢”

在智慧城市建设中,昇腾芯片发挥着“智能中枢”的作用 。通过对城市中各种数据的采集和分析,包括交通流量、环境监测数据、能源消耗数据等,昇腾芯片可以帮助城市管理者做出更科学的决策。比如根据实时的交通流量数据,优化交通信号灯的时长,缓解交通拥堵;根据环境监测数据,及时发现环境污染问题并采取措施等,让城市的运行更加高效、便捷、绿色。

(四)智慧金融:金融服务的“智能助手”

在智慧金融领域,昇腾芯片可以帮助金融机构实现智能化的风险评估、客户信用分析、智能客服等功能 。通过对大量金融数据的分析,快速准确地评估贷款风险,为客户提供更个性化的金融服务。智能客服还能快速回答客户的问题,提高客户服务效率,降低人力成本。

六、昇腾芯片面临的挑战与未来展望

虽然昇腾芯片取得了很大的成就,但在发展过程中也面临着一些挑战。

一方面,美国的制裁对昇腾芯片的发展造成了一定的阻碍,在芯片制造工艺、关键材料等方面面临着技术封锁和供应限制 。比如说,在芯片制造工艺上,由于无法使用更先进的制程工艺,可能会影响芯片性能的进一步提升;在关键材料方面,像hbm高带宽内存等,部分还依赖海外厂商,存在供应风险。

另一方面,市场竞争也非常激烈。在全球AI芯片市场,除了英伟达等国际巨头,还有众多新兴的AI芯片企业不断涌现,都在争夺市场份额。昇腾芯片需要不断提升技术实力和产品性能,加强市场推广和生态建设,才能在激烈的竞争中立于不败之地。

不过,我们对昇腾芯片的未来还是充满信心的。华为一直以来都非常重视技术研发,不断加大投入,在芯片架构设计、计算技术、封装技术等方面持续创新 。而且,随着国内半导体产业的不断发展,越来越多的国内企业在芯片制造、材料供应等方面取得了进步,这也为昇腾芯片的发展提供了有力的支持。

从长远来看,随着人工智能技术的不断发展,对AI算力的需求会越来越大。昇腾芯片有望在更多领域得到应用,推动各行各业的智能化升级 。同时,华为也在不断完善昇腾芯片的生态系统,吸引更多的开发者和企业加入,共同推动人工智能产业的发展。相信在未来,昇腾芯片一定能够在国产AI芯片领域继续发光发热,成为全球AI芯片市场的重要力量,为我国的科技发展和经济建设做出更大的贡献。

CC读书推荐阅读:百亿豪门穿兽世,投喂对象抢疯了边疆小卒的逆天崛起以死谢罪?重生后全宗门跪求原谅晚来情谊深二次元之斩神调包后,狼山小公主大杀四方宠爱太多太难选离婚吧,别耽误我泡小鲜肉万界保管员:开局穿梭机被曝光修为尽废后,我被逼退出宗门处处找茬?侯府小姐我不当了婚礼当天,老公朋友圈官宣白月光了穿越古代,我被团宠了瘸腿大师姐带着宗门飞升了海贼:这个海军强到离谱黑神话西游:神佛!吃俺老孙一棍圣子大人没有心我到民国当间谍周易哲学渣了腹黑女后我的诸天无限流,从要你狗命开始气运被夺后,她虐哭宗门所有人医妃归来:重生嫡女杀疯了!断亲单开族谱,柔弱表小姐不好欺神医娘亲一出门,各地大佬追着宠斗罗:穿成唐三姐姐后我封神了长相思之寒柳依依九叔:简化金光咒,晒太阳就变强女神异闻录:书与命运的彼方废材巫女的鬼怪们港综:称霸香江从庙街开始娱乐:息影五年!我的女粉丝全是一线明星?港综:普通道士?随手就是五雷咒超兽武装:轮回者的系统无拘无束游走诸天快穿:病娇反派又被宿主撩迷糊了斗罗:趁雪帝落难,忽悠她做老婆被宗门诬陷后大师姐杀疯了武夫借剑无限之我的金主真难哄爱与租约快穿:满级大佬,在线追夫爱情公寓:我的幸福生活烧火丫鬟嫁东宫:太子,求你疼我薅光系统羊毛后,她飞升了古墓新娘,冥王宠得心慌慌你人皇幡都冒邪气了,还装赘婿?AI说:卷什么?躺平才可能躺赢特种姐妹穿七零,给列强亿点震撼
CC读书搜藏榜:这个宗门大有问题承光集亮剑:团长听我解释,我真是群演穿书:救赎疯批男主后,剧情崩了什么?我和二狗子杀遍了诸天hp:和德拉科相爱相杀的那些年快穿:宿主为远离小黑屋一路狂奔网游之幻兽使一吻定情,总裁的天价影后穿书后踢开男主,抱紧反派大腿重生复仇:我与夫人分天下红色王座圣骑士编年史1961刚刚入职的我获得了系统报告帝君,您的下属又想搞恋爱脑药神,从我不是药神开始蜜之仇九尾灾荒年:娘子有空间,婆家宠上天仙缘无双传晚来情谊深游云惊凤不求长生,只为称帝几度夕阳生HP:救世主今天又在消极怠工我隔着月亮,慢慢回头望火影:岩石巨人吊打高达兔兔生存记夜夜笙歌,公主殿下专宠暗卫白描情书邪修师妹拯救了全宗门赛博朋克:战争步行者插翅难逃,又被疯批世子逮回去了为君倾心绝世冥王妃网游——屠龙巫师八零大佬别虐了,夫人才是白月光美漫:从疯人院毕业后做蝙蝠侠凤朝华快穿之女配咸鱼人生皇女请回家偏执!疯批!真千金是朵黑莲花重生清冷貌美少年练习生后去选秀我在相声社团当团宠千户待嫁幸好正当时重生之千金小姐养成系你已进入选择模式刘一的仙途奇缘反派他每天都想欺师灭祖HP:掠夺者们有被迫害妄想症
CC读书最新小说:落寞千金终成凰大白话聊透人工智能男主男配又看上普女啦!一睁眼,成了资产过亿的富婆!熊出没之森林生存大挑战加入寰宇巨企的我太爽了重生替嫁:千亿妈咪携四宝炸全球心剑破道:独尊九天毒煞七玄医妃携系统,废柴世子宠上天冷面大佬的致命偏宠盗墓:穿越盗笔当神仙魔修兵王共闯恐游,双向救赎和亲公主靠吃瓜为生我的通透活法轨怨:打工夫妻的异地生活觉醒指南从一碗粥到一朵花成语认知词典:解锁人生底层算法我的治愈游戏成真了宝可梦:开局毒贝比成就大师遇见陈宇白蛇:小青,小白:我有玄蛇弟弟重生孤鸿子,我在峨眉练神功神探驸马从选择钟晓芹开始获得老婆的能力星雨落寒江你惹她干嘛?她敢徒手揍阴天子四合院:淮茹晓娥,我全都要!综影视:死后入编角色扮演部短篇合集系列3原来我是情劫啊求竹马们贴贴,我有皮肤饥渴症电力设计院的日常锦衣卫:从小捕快杀到锦衣卫头子穿成檀健次低谷期的路人甲乙丙穿越之女尊我左拥右抱港综:左零右火,雷公助我南波万的无限流游戏遭了!我男朋友好像是个恋爱脑!大胤夜巡司快穿:心机恶女上位实录凤栖深宫:废后归来明日方舟,全员魔法少女?!说书人还是救世主?末法贷仙三角洲求生,开局招募年轻德穆兰江山劫,揽月明绿茶病美人私底下烟酒都来啊入间同学入魔了之没有存在感就会缠娇鸾