国产GPU“四小龙”最后一块拼图落定!7月18日,上海芯片企业瀚博半导体正式启动A股IPO辅导,估值105亿的它,背后站着两位AMD华人技术领袖,CEO钱军曾带队量产全球首颗7nmGPU,CTO张磊是AMD史上少有的“院士”级专家。
这家成立仅6年的公司,手握两代自研7nm芯片,产品打入快手视频渲染、阿里云智算中心,甚至让联发科甘当股东。
国内GPU赛道正上演“上市竞速赛”:摩尔线程、沐曦上月刚获科创板受理,壁仞科技和燧原科技也在辅导期,五家技术派公司融资超200亿,只为打破英伟达95%的垄断。
技术派创业,AMD双雄的“中国芯”
上海浦东张江的集成电路产业园里,瀚博半导体的Logo并不显眼。
推开研发中心大门,500多名工程师的团队规模,在国产GPU公司中仅次于摩尔线程的800人军团。
墙上贴着两行标语:“每颗晶体管都要为算力拼命”“7nm只是起点”。
钱军的办公室堆满芯片原型。
这位上海交大毕业的芯片老将,在AMD硅谷总部干了15年,曾指挥千人团队攻克7nm工艺,让AMD显卡性能首次反超英伟达。
2018年回国时,他行李箱里塞着三份技术蓝图,最终与老同事张磊一拍即合。
张磊的履历更传奇,在AMD多伦多研究所主导AI加速芯片设计,拥有25项专利,AMD为留住他授予最高技术职级“Fellow”(院士),全球仅百余人获此头衔。
他们的首款产品就瞄准硬骨头:云端视频处理。
2020年流片的半定制7nm芯片,能在1毫秒内完成4K视频编解码,快手当即砸钱投资,用于直播实时特效处理。
2022年量产的SV系列GPU,直接部署在阿里云华北数据中心,为电商大促期间的图像搜索提速3倍。
实验室里躺着第二代王牌SG100。
这颗7nm全功能GPU集成1280个计算核心,浮点算力达40TFLOPS,相当于英伟达2022年旗舰A100的70%性能。
2023年量产时,团队用它在江苏智慧工厂跑通了数字孪生系统,50台机床的实时模拟能耗降低40%。
资本狂欢,国有基金联手互联网巨头
翻开股东名册,瀚博的融资节奏堪称“芯片界闪电战”:2020年A轮5000万美元刚落袋,隔年就拿下16亿人民币B轮融资,创下当年GPU单轮融资纪录。
2025年4月最新一轮,盐城、青岛等地国有资本集体进场,公司估值冲破百亿。
阿里巴巴的入股最耐人寻味。
浙江阿里云持股4.44%,成为仅次于中国互联网投资基金(2.78%)的机构股东。
知情人士透露,阿里云2023年采购了瀚博2000张加速卡,用于双11商品推荐算法。
瀚博架构师团队已入驻杭州云栖小镇,与平头哥半导体联合调试下一代CIPU(云基础设施处理器)。
快手的投资则带着场景需求。
工程师在亦庄数据中心演示了一段Demo:用瀚博显卡实时渲染虚拟偶像直播,头发丝级的光追效果,功耗比传统方案低50%。
联发科的加入瞄准了车规级芯片,双方正在测试边缘GPU,用于智能座舱的3D仪表盘。
股权架构里藏着硬核设计。
钱军通过直接持股和KJQLP基金控制19.2%投票权,张磊通过离岸公司VASTAIHolding掌控12.8%,加上17个员工持股平台,两人牢牢锁定42.15%决策权。
这种“双核心+全员持股”模式,与壁仞科技创始人张文“单巨头控股”形成鲜明对比。
国产GPU的“上市竞速赛”
上交所科创板正迎来史上最拥挤的GPUIPO季。
6月30日,摩尔线程募资80亿的申请刚获受理,沐曦股份39亿募资计划就紧随其后。
这两家公司的招股书,揭开国产GPU的残酷现状:摩尔线程三年亏50亿,沐曦累计烧光33亿。
摩尔线程的杀手锏是兼容CUDA生态。
创始人张建中曾任英伟达中国区老大,他带队开发的MTTS3000显卡,能直接运行英伟达的CUDA程序。
北京亦庄某智算中心采用该卡运行千亿参数大模型,替换了30%的英伟达A800。
美国实体清单的制裁,让该公司7nm流片被迫转战中芯国际。
沐曦股份则死磕高性能计算。
其曦云C系列显卡单卡算力媲美A100,上海超算中心用500张卡搭建的集群,在2024年全球超算大会上跑出1027TFLOPS的Linpack成绩。
招股书显示,沐曦90%收入依赖政府采购。
壁仞科技选择另辟蹊径。
其BR100芯片采用Chiplet设计,算力达英伟达H100的3倍,代价是功耗高达1200W。
知情人士透露,该芯片主要供给国家实验室,单颗售价超10万元。
英伟达阴影下的生死突围
所有国产GPU公司都在对抗两座大山:英伟达2024年129亿美元的研发投入(约合900亿人民币),以及全球开发者构建的500万CUDA开发生态。
中关村某服务器厂商的测试报告显示,运行同样的大模型训练,国产显卡的调试时间平均增加47小时。
瀚博的解法是绑定场景巨头。
在青岛港的智慧调度中心,瀚博显卡驱动着2000路摄像头,实时识别集装箱编号。
该系统替代了英伟达TeslaT4,每天节电8000度。
阿里云工程师更透露,瀚博驱动了淘宝“拍立淘”30%的图像匹配请求。
生态短板正被政策填补。
北京经开区规定,企业采购国产GPU可获30%补贴。
上海临港新片区的芯片中试线,为瀚博提供了7nm流片补贴,单次成本降低40%。
技术差距仍肉眼可见。
英伟达2025年量产的Blackwell架构GPU,采用3nm工艺和光追单元,单卡算力突破20PFLOPS。
国产最先进的壁仞BR104仍停留在7nm,摩尔线程的5nm计划尚未公布时间表。
弘益配资-沈阳股票配资-在线炒股配资看必选-免费股票配资平台官网提示:文章来自网络,不代表本站观点。