人工智能是年轻的事业,也是年轻人的事业。
清程极智联合创始人师天麾正成为这句话的一个生动的注脚,而他的经历也是当前中国年轻一代AI高端人才的缩影mdash;mdash;高中拿下信息学奥林匹克竞赛金奖保送清华大学,大学确定了系统和高性能计算的研究方向,博士毕业后成为中国科学院计算技术研究所课程讲师、中国信通院万卡智算集群服务能力推进方阵技术专家。
多个身份标签加持下,互联网大厂曾向师天麾抛出高薪的橄榄枝,他最终却选择自己创业,理由也很简单做一些不同的事,他眼中,大厂老板安排和KPI均是束缚,创新将难以开展。
在AI圈,年轻的身影已然显眼。2024异军突起的Kim i由90后杨植麟领军,2025年席卷全球的Deep-Seek核心团队成员由清北的应届毕业生组成。根据猎聘大数据研究院报告,近一年AI技术活跃人才中,30岁以下的人才占比59.90%。
如今,创立一年多时间,清程极智已同时入驻上海模速空间和北京人工智能创新街区,作为清华系AI In fra创新企业,员工平均年龄不到30岁。
作为一名95后,师天麾的身上看不到老一辈人心中那座名为技术差距的大山。面对新京报AI研究院关于算力、创新等问题时,师天麾坦言,英伟达从建立起CUDA到很多人用,其实也没有很久。国产芯片只要解决好更好用的问题,以国内的工业制造能力,将以超高性价比在竞争中胜出。
创业
感受代码写得特别快的愉悦
新京报:你最早接触AI是什么时候,为何选择这个行业?
师天麾:我最早接触AI要追溯到初高中加入信息学奥林匹克竞赛小组的时候,当时的学习内容主要为算法和数据结构。之所以学习奥赛,主要是对计算机感兴趣,还能偷偷打游戏。高二的暑假,我获得了2014全国青少年信息学奥林匹克竞赛金牌,保送了清华大学计算机系。
在我的大学期间,人工智能已经迎来了以智能驾驶和CV为主的第一波浪潮,大二时,我还没想好将来是就业还是从事科研,于是去了智能驾驶企业M omenta实习研究算法。经过工作实践,我发现人工智能算法的黑箱特性导致可解释性不强,这无法给我很高的成就感。大三时,我去商汤科技的高性能计算部门进行了尝试,才找到了自己真正的兴趣所在。
实际上,信息学奥林匹克竞赛本身就对程序运行的时间有要求,这也让我对把一份代码写得特别快很感兴趣,最终我成为清华大学高性能计算研究所翟季冬老师的博士。在博士研究过程中,多年积累也为创业提供了条件。2023年,我们清程极智成立,主要以清华计算机系高性能计算所的师兄弟为主要班底,清程主要做AI Infra。
简单来讲,AI Infra是连接硬件与AI算法之间的中间层,通过我们的软件,客户可以在相同的硬件资源上实现更快的推理速度和更高的并发性能,实现AI应用落地更高效、更低成本,让国产硬件也能比肩英伟达。
新京报:清程极智的员工非常年轻,团队为何是这样的组合?
师天麾:我们团队30岁以上的人很少,只有三名80后。年龄最大的为1985年出生,最小的则是一名已经保送清华的高三实习生。相比学校更侧重理论基础学习,企业可以真正让理论学以致用。当我们把一个实际问题足够细化,最后就会变成一个题目,交给这名高三实习生后,他用一两天时间就做完了一周的工作,并且反馈说终于明白了在学校学习的计算机理论基础有什么用。
我们团队年轻的原因一方面是所在的行业比较热门,团队技术背景也很好,对同学们挺有吸引力的,所以一些刚出校门的同学就加入清程了。另一方面其实AI infra研究相关职位并不好招人,相比算法,我们的工作更加偏向底层,圈子就这么大。所以,我们也愿意招一些有想法、有热情、基础扎实、学习能力强的年轻人进行培养,有些甚至是在校生。同时,AI行业本身也比较年轻,有些担起重任的技术大佬也是95后甚至00后,也就是互联网原住民一代。
商机
从训练转向推理,踩点Deep Seek爆火
新京报:今年1月底开始,DeepSeek爆火,作为从事算力研究的AI Infra公司,你们受到了怎样的影响?
师天麾:春节期间打开手机,朋友圈到处都是DeepSeek的消息。很多去年和我们合作的国产公司开始密集和我们探讨怎样快速适配DeepSeek。春节期间,我们和这些公司几乎每天都在沟通。
DeepSeek采用M oE架构,我们在前几年M oE刚出现时就判断它会成为未来的重要趋势,因此进行了M oE模型训练、推理加速的技术积累,也发表了一些国际顶级会议的论文。
清程极智的客户生态主要包括硬件厂商、大模型研发企业以及有数字化转型需求的企业。去年,大模型训练的需求高于推理的需求,但随着DeepSeek出现,企业对推理服务的需求正超越传统的训练需求,而我们推出的DeepSeek一体机以低技术门槛,让企业在无需专业AI团队支撑的环境下也能部署并使用大模型,作用类似于AI领域的傻瓜相机。
我们做推理的优势很大,因为DeepSeek需要多机器推理,涉及上层并行计算的优化,这方面我们有面向超大规模国产算力集群研制的大模型训练系统八卦炉,计算能力已扩展到10万台服务器超大规模集群,所以在多机并行计算、通信优化等方面经验丰富,将这一数量级的集群优化经验放到几台机器上,做起来非常顺手。
目前,我们的一体机产品部署较多的主要有Deep?Seek、智谱GLM 、Qwen和llama等主流模型。
新京报:发展大模型,算力是一个绕不开的话题。英伟达在这一领域经营多年,甚至衡量一家企业的算力往往是看其拥有多少张英伟达卡。你的发展愿景会是成为下一个英伟达吗?
师天麾:相比于成为英伟达,我们的定位更类似于帮助国产芯片比肩英伟达。让国产芯片以及老旧英伟达芯片的能力达到和英伟达新版芯片一样。今年初,清程极智与清华共同开源了大模型推理引擎赤兔,通过赤兔的部署,让英伟达老卡旧卡及国产芯片可以支持FP8精度模型,从而能够运行DeepSeek满血版。下一步,我们也在尝试让CPU服务器也能高效运行大模型。
当前,国产硬件正在慢慢变成熟,但这需要一定的过程,比如我们在使用国产硬件时会发现一些底层Bug,此时我们会和对方进行反馈。
其实,英伟达从建立起CUDA生态到很多人用,时间上也没有很久,其崛起的主要因素是赶上了GPU适配AI训练推理的技术红利期。所以归根结底,这还是国产生态的问题mdash;mdash;不一定需要一味在硬件上追逐赶超,通过软硬协同一样能让国产显卡更好用,以我国在工业制造领域强大的产业化能力,参照手机、汽车等行业的演进轨迹,完全具备在合理周期内实现显卡产品的性价比突破。
当前,很多央国企已批量采购国产显卡设备,但实际部署时仍依赖海外推理引擎,而部分前瞻性客户已启动专项采购流程,将国产推理引擎纳入采购流程,这标志着市场对纯国产技术栈的认可度正在提升。
当前,DeepSeek的出现证明国产大模型已经不输世界一流模型了,如果不用上同样好的国产显卡和推理引擎,生态就不完整,只有生态好,算力国产化的目标才能更好实现。
我们的最终目标是:不管底层的硬件是什么,只要通过我们的软件引擎,都能够感受到相同性能的算力服务,规避掉硬件的差异。
抉择
KPI压力带不来创新
新京报:DeepSeek的团队也很年轻,你怎么看待他们在创新方面的成功?
师天麾:DeepSeek做得很好,原因之一当然是他们招揽的人才非常厉害。我们组博二和博三的同学全部收到过DeepSeek的邮件。相比大厂,DeepSeek少了一些KPI的压力,更类似于学校里博士从事的科研工作,即找一个有意思的点,尽量去实现。做一件有意义的事情,但不要求给我带来多少收益。
一旦有了KPI的压力,往往就不敢去做收益不确定的事情,会更加倾向于复制已有的、明确的路径,这不会冒险,但也做不出特别不一样的东西。
新京报:以你自身的经历来看,AI相关专业毕业生在初创企业、大厂与学校科研之间如何抉择?在企业的经历和实验室有何不同?
师天麾:我博士毕业后,就已经有大厂发来了薪资很高的offer,但我当时更倾向于创业,做一些不同的事。在大厂,大多情况下是老板安排什么就做什么,同时要背负一定KPI,如果被这些东西束缚住,可能一些事情将难以开展。当初如果我选择了大厂,可能也会先待两三年熟悉产业界,有了经验再出来创业。对于大厂来说,是你就值这个钱,你必须做这件事才能发挥价值。
在清程极智,我们基本很少加班,氛围开放并不内卷。我们对自己的技术非常有信心,我们相信,顶级的技术人员不是逼着加班就能释放出生产力的,最重要的是不受限制的创造力。
对于学界与企业的区别,学校的实验室会更多地从技术角度分析一件事,比如大模型训练推理系统的性能瓶颈在哪里,如何解决使其加速。在学校,1万行代码就能验证一个想法,但要把这个想法变成可用、稳定、几乎没有Bug的产品,可能需要几十万代码。这就是企业要做的,对于企业的产品,性能好并不代表绝对好用,需要更多权衡,更多产品工程化。
同时,实验室对于投产比没有那么在意。企业则需要向投资人交代,试错成本不能太大。最后,二者的节奏也有所不同,企业需要看市场上客户真正需要什么,需要从用户角度来考虑市场的变化,并进行积极地适配。
人工智能是年轻的事业,也是年轻人的事业。
清程极智联合创始人师天麾正成为这句话的一个生动的注脚,而他的经历也是当前中国年轻一代AI高端人才的缩影mdash;mdash;高中拿下信息学奥林匹克竞赛金奖保送清华大学,大学确定了系统和高性能计算的研究方向,博士毕业后成为中国科学院计算技术研究所课程讲师、中国信通院万卡智算集群服务能力推进方阵技术专家。
多个身份标签加持下,互联网大厂曾向师天麾抛出高薪的橄榄枝,他最终却选择自己创业,理由也很简单做一些不同的事,他眼中,大厂老板安排和KPI均是束缚,创新将难以开展。
在AI圈,年轻的身影已然显眼。2024异军突起的Kim i由90后杨植麟领军,2025年席卷全球的Deep-Seek核心团队成员由清北的应届毕业生组成。根据猎聘大数据研究院报告,近一年AI技术活跃人才中,30岁以下的人才占比59.90%。
如今,创立一年多时间,清程极智已同时入驻上海模速空间和北京人工智能创新街区,作为清华系AI In fra创新企业,员工平均年龄不到30岁。
作为一名95后,师天麾的身上看不到老一辈人心中那座名为技术差距的大山。面对新京报AI研究院关于算力、创新等问题时,师天麾坦言,英伟达从建立起CUDA到很多人用,其实也没有很久。国产芯片只要解决好更好用的问题,以国内的工业制造能力,将以超高性价比在竞争中胜出。
创业
感受代码写得特别快的愉悦
新京报:你最早接触AI是什么时候,为何选择这个行业?
师天麾:我最早接触AI要追溯到初高中加入信息学奥林匹克竞赛小组的时候,当时的学习内容主要为算法和数据结构。之所以学习奥赛,主要是对计算机感兴趣,还能偷偷打游戏。高二的暑假,我获得了2014全国青少年信息学奥林匹克竞赛金牌,保送了清华大学计算机系。
在我的大学期间,人工智能已经迎来了以智能驾驶和CV为主的第一波浪潮,大二时,我还没想好将来是就业还是从事科研,于是去了智能驾驶企业M omenta实习研究算法。经过工作实践,我发现人工智能算法的黑箱特性导致可解释性不强,这无法给我很高的成就感。大三时,我去商汤科技的高性能计算部门进行了尝试,才找到了自己真正的兴趣所在。
实际上,信息学奥林匹克竞赛本身就对程序运行的时间有要求,这也让我对把一份代码写得特别快很感兴趣,最终我成为清华大学高性能计算研究所翟季冬老师的博士。在博士研究过程中,多年积累也为创业提供了条件。2023年,我们清程极智成立,主要以清华计算机系高性能计算所的师兄弟为主要班底,清程主要做AI Infra。
简单来讲,AI Infra是连接硬件与AI算法之间的中间层,通过我们的软件,客户可以在相同的硬件资源上实现更快的推理速度和更高的并发性能,实现AI应用落地更高效、更低成本,让国产硬件也能比肩英伟达。
新京报:清程极智的员工非常年轻,团队为何是这样的组合?
师天麾:我们团队30岁以上的人很少,只有三名80后。年龄最大的为1985年出生,最小的则是一名已经保送清华的高三实习生。相比学校更侧重理论基础学习,企业可以真正让理论学以致用。当我们把一个实际问题足够细化,最后就会变成一个题目,交给这名高三实习生后,他用一两天时间就做完了一周的工作,并且反馈说终于明白了在学校学习的计算机理论基础有什么用。
我们团队年轻的原因一方面是所在的行业比较热门,团队技术背景也很好,对同学们挺有吸引力的,所以一些刚出校门的同学就加入清程了。另一方面其实AI infra研究相关职位并不好招人,相比算法,我们的工作更加偏向底层,圈子就这么大。所以,我们也愿意招一些有想法、有热情、基础扎实、学习能力强的年轻人进行培养,有些甚至是在校生。同时,AI行业本身也比较年轻,有些担起重任的技术大佬也是95后甚至00后,也就是互联网原住民一代。
商机
从训练转向推理,踩点Deep Seek爆火
新京报:今年1月底开始,DeepSeek爆火,作为从事算力研究的AI Infra公司,你们受到了怎样的影响?
师天麾:春节期间打开手机,朋友圈到处都是DeepSeek的消息。很多去年和我们合作的国产公司开始密集和我们探讨怎样快速适配DeepSeek。春节期间,我们和这些公司几乎每天都在沟通。
DeepSeek采用M oE架构,我们在前几年M oE刚出现时就判断它会成为未来的重要趋势,因此进行了M oE模型训练、推理加速的技术积累,也发表了一些国际顶级会议的论文。
清程极智的客户生态主要包括硬件厂商、大模型研发企业以及有数字化转型需求的企业。去年,大模型训练的需求高于推理的需求,但随着DeepSeek出现,企业对推理服务的需求正超越传统的训练需求,而我们推出的DeepSeek一体机以低技术门槛,让企业在无需专业AI团队支撑的环境下也能部署并使用大模型,作用类似于AI领域的傻瓜相机。
我们做推理的优势很大,因为DeepSeek需要多机器推理,涉及上层并行计算的优化,这方面我们有面向超大规模国产算力集群研制的大模型训练系统八卦炉,计算能力已扩展到10万台服务器超大规模集群,所以在多机并行计算、通信优化等方面经验丰富,将这一数量级的集群优化经验放到几台机器上,做起来非常顺手。
目前,我们的一体机产品部署较多的主要有Deep?Seek、智谱GLM 、Qwen和llama等主流模型。
新京报:发展大模型,算力是一个绕不开的话题。英伟达在这一领域经营多年,甚至衡量一家企业的算力往往是看其拥有多少张英伟达卡。你的发展愿景会是成为下一个英伟达吗?
师天麾:相比于成为英伟达,我们的定位更类似于帮助国产芯片比肩英伟达。让国产芯片以及老旧英伟达芯片的能力达到和英伟达新版芯片一样。今年初,清程极智与清华共同开源了大模型推理引擎赤兔,通过赤兔的部署,让英伟达老卡旧卡及国产芯片可以支持FP8精度模型,从而能够运行DeepSeek满血版。下一步,我们也在尝试让CPU服务器也能高效运行大模型。
当前,国产硬件正在慢慢变成熟,但这需要一定的过程,比如我们在使用国产硬件时会发现一些底层Bug,此时我们会和对方进行反馈。
其实,英伟达从建立起CUDA生态到很多人用,时间上也没有很久,其崛起的主要因素是赶上了GPU适配AI训练推理的技术红利期。所以归根结底,这还是国产生态的问题mdash;mdash;不一定需要一味在硬件上追逐赶超,通过软硬协同一样能让国产显卡更好用,以我国在工业制造领域强大的产业化能力,参照手机、汽车等行业的演进轨迹,完全具备在合理周期内实现显卡产品的性价比突破。
当前,很多央国企已批量采购国产显卡设备,但实际部署时仍依赖海外推理引擎,而部分前瞻性客户已启动专项采购流程,将国产推理引擎纳入采购流程,这标志着市场对纯国产技术栈的认可度正在提升。
当前,DeepSeek的出现证明国产大模型已经不输世界一流模型了,如果不用上同样好的国产显卡和推理引擎,生态就不完整,只有生态好,算力国产化的目标才能更好实现。
我们的最终目标是:不管底层的硬件是什么,只要通过我们的软件引擎,都能够感受到相同性能的算力服务,规避掉硬件的差异。
抉择
KPI压力带不来创新
新京报:DeepSeek的团队也很年轻,你怎么看待他们在创新方面的成功?
师天麾:DeepSeek做得很好,原因之一当然是他们招揽的人才非常厉害。我们组博二和博三的同学全部收到过DeepSeek的邮件。相比大厂,DeepSeek少了一些KPI的压力,更类似于学校里博士从事的科研工作,即找一个有意思的点,尽量去实现。做一件有意义的事情,但不要求给我带来多少收益。
一旦有了KPI的压力,往往就不敢去做收益不确定的事情,会更加倾向于复制已有的、明确的路径,这不会冒险,但也做不出特别不一样的东西。
新京报:以你自身的经历来看,AI相关专业毕业生在初创企业、大厂与学校科研之间如何抉择?在企业的经历和实验室有何不同?
师天麾:我博士毕业后,就已经有大厂发来了薪资很高的offer,但我当时更倾向于创业,做一些不同的事。在大厂,大多情况下是老板安排什么就做什么,同时要背负一定KPI,如果被这些东西束缚住,可能一些事情将难以开展。当初如果我选择了大厂,可能也会先待两三年熟悉产业界,有了经验再出来创业。对于大厂来说,是你就值这个钱,你必须做这件事才能发挥价值。
在清程极智,我们基本很少加班,氛围开放并不内卷。我们对自己的技术非常有信心,我们相信,顶级的技术人员不是逼着加班就能释放出生产力的,最重要的是不受限制的创造力。
对于学界与企业的区别,学校的实验室会更多地从技术角度分析一件事,比如大模型训练推理系统的性能瓶颈在哪里,如何解决使其加速。在学校,1万行代码就能验证一个想法,但要把这个想法变成可用、稳定、几乎没有Bug的产品,可能需要几十万代码。这就是企业要做的,对于企业的产品,性能好并不代表绝对好用,需要更多权衡,更多产品工程化。
同时,实验室对于投产比没有那么在意。企业则需要向投资人交代,试错成本不能太大。最后,二者的节奏也有所不同,企业需要看市场上客户真正需要什么,需要从用户角度来考虑市场的变化,并进行积极地适配。
声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。
近几年,伴随着新能源汽车快速发展,新能源品牌也在不断涌现。据统计,2022年国内...
2023-06-26
2023-04-08
2023-04-05