智东西(公众号:zhidxcom)
作者 | 陈骏达
编辑 | 云鹏
这位拥有(you)25亿美元(约合人民币179亿元)身家的大学教授,为何还坚(jian)守(shou)在一线课堂?
智东西9月2日报道,近日,AI数据平台Databricks在最新一轮融资后,估值突破1000亿美元(约合人民币7162亿元),有望成为全球估值第四高的AI独角兽,这也让外界关注到其联合创始人兼董事长、加州大学伯克利分校(后简称UCB)教授Ion Stoica,以及他横(heng)跨产(chan)业与学术(shu)界的传(chuan)奇经历(li)。
Stoica现年60岁,自2000年起开始在UCB任教,此后25年来均未离开这一校园。2010年至今,Stoica在UCB计算机学院参与了3所重要实验室的创办和管理。这些实验室在大数据、云计算和AI时代贡献了118个科研项目,其中不乏影响力广泛、几乎成为AI领域核心基础设施的项目,如大(da)数据框(kuang)架(jia)Spark、分(fen)布式(shi)执行框(kuang)架(jia)Ray、大(da)模型推(tui)理框(kuang)架(jia)vLLM等。

▲Ion Stoica(图源:YouTube)
他还通过亲自参与创业、指导创业或是提供人脉与资金支持的方式,创(chuang)办或(huo)孵化了至(zhi)少7家知名创(chuang)企,分布于数据(ju)基础设施、生成式AI等行业(ye)。
除了估值已经突破1000亿美元的Databricks,Stoica联合创办了估值10亿美元的AI托管计算平台Anyscale、估值6亿美元的LMArena(大模型竞技场(chang))和估值3亿美元的视频流分析技术公司Conviva等企业。
Stoica是高性能AI与数据分析平台Alluxio创始人李浩源、数据中心操作系统创企Mesosphere创始人Benjamin Hindman的博士生导师,这两家创企均发源于开源项目,曾得到Stoica的指导。目前,Stoica还在大模型记忆技术创企Letta担任顾问。
尽管取得了商业上的成功,但Stoica仍然心系教育、科研。今年秋天,Stoica将继续留在课堂,教授操作系(xi)统和(he)系(xi)统编程(cheng)的(de)本(ben)科(ke)课程(cheng)。
通过在硅谷的人脉,Stoica给自己的实验室拉来了极为豪华的赞助商阵容,包括英(ying)伟达、Meta、蚂蚁集团、AMD、谷歌、亚马(ma)逊(xun)、华(hua)为(wei)等知名企业(ye)(ye)。他还(hai)给将自己(ji)创业(ye)(ye)获得的资产(chan)投(tou)入科研(yan),给实验(yan)室提供资金支持(chi)。
在向《福布斯》分析自己成功的原因时,Stoica称,这要(yao)归功于他(ta)对科研的专注:“这是一种创(chuang)造(zao)的过程,不断探(tan)索新想法。”在本(ben)文中,我们(men)将回顾Stoica传奇的创(chuang)业与科研(yan)经历,并了解他对自(zi)己(ji)成功经历的思考和(he)总结。
一、师从北大计算机校友张晖,06年首次开启创业
Stoica于2000年在卡耐(nai)基(ji)梅(mei)隆大(da)学(后(hou)简(jian)称(cheng)CMU)完(wan)成博士学业,导师是该校史(shi)上最年轻的终(zhong)身教(jiao)授(shou)张晖(hui)(北大(da)计算机学院(yuan)84级(ji)院(yuan)友)。
同年,他加入(ru)UCB,并从教至(zhi)今。UCB地(di)处(chu)硅谷,有极(ji)为(wei)浓(nong)厚的(de)创(chuang)业氛围,Stoica也在2006年了自己的(de)第一个创(chuang)业项(xiang)目——Conviva。

▲Conviva的创始团队(dui)(图源:Conviva官(guan)网)
2006年,流媒体内容逐渐兴起,YouTube已经成(cheng)为主流平台之一。Stoica与他的导(dao)师张晖看到了市场对在(zai)线视频体验(yan)优(you)化的需求,并(bing)在(zai)CMU和(he)UCB的科研成(cheng)果(guo)基础之上开(kai)始(shi)创业,联(lian)合(he)创办了Conviva。
早(zao)(zao)期,Conviva专注于实(shi)时(shi)视频流分析,成为全球最早(zao)(zao)实(shi)现视频播放自(zi)适应的平台之一(yi)。该公司(si)通过AI技术识别视频平台的播放质(zhi)量问题,并收集用(yong)户的观(guan)看数据(包括(kuo)正在观(guan)看的内(nei)容、用(yong)户喜好等),形成分析报告。
Conviva的主(zhu)要客户(hu)包括美国福克斯公司(FOX)、NBC环球集团旗下的流媒(mei)体平台Peacock等(deng)。
Stoica原本(ben)在(zai)Conviva担(dan)任CTO一职(zhi),但目前已经不在(zai)Conviva拥有正式(shi)管理层职(zhi)位。他仍然留在(zai)董事(shi)会,每周都会与团队见面(mian)。
成(cheng)立以来,Conviva已经(jing)完(wan)成(cheng)了7轮融资,总融资额为1.1亿(yi)(yi)美(mei)元。其上一轮融资于2017年完(wan)成(cheng),当时投后估值(zhi)约为3亿(yi)(yi)美(mei)元。
二、给大数据时代打造核心基础设施,成果转化为千亿估值创企
在创办(ban)Conviva的同时,Stoica也没有停下学(xue)术与科研的脚步。UCB计(ji)算机科学(xue)学(xue)部有每5年成(cheng)立一个(ge)合作实验室的传统,Stoica深(shen)度参(can)与了该(gai)学(xue)部近15年来成(cheng)立的三大(da)实验室,带(dai)领成(cheng)员做(zuo)出(chu)了颇具(ju)学(xue)术与行业(ye)影(ying)响力的成(cheng)果。
2011年,UCB成立(li)了AMP(算法(fa)、机(ji)器(qi)与人)实验室(shi)。在官宣实验室(shi)成立(li)的演(yan)讲中,Stoica称,AMP实验室(shi)希望通过紧密集成算法(fa)、机(ji)器(qi)和人力(li),实现对大数据的理(li)解。
在(zai)其存(cun)续(xu)的5年间,AMP实验(yan)室打(da)造(zao)了(le)25个科(ke)研项目,包括开(kai)(kai)(kai)源分(fen)布式(shi)资源管理(li)框(kuang)架Apache Mesos、开(kai)(kai)(kai)源分(fen)布式(shi)大(da)数(shu)据(ju)处理(li)框(kuang)架Apache Spark、开(kai)(kai)(kai)源分(fen)布式(shi)数(shu)据(ju)编(bian)排(pai)平台Alluxio(原名Tachyon)等,成为大(da)数(shu)据(ju)基础设(she)施(shi)领域(yu)的重(zhong)要(yao)贡献者(zhe)。
这三大开源项目,最后都转化为创企:
Databricks(总融资208亿美元,估值超1000亿美元)
Databricks是Stoica参与创办(ban)的(de)第二家创企,主营业务是AI数据分析平(ping)台(tai)。其创始团(tuan)队由七位加(jia)州大学伯克利分校的(de)教授(shou)和研究生组成,大都来(lai)自(zi)Stoica所管理(li)的(de)AMP实验室。

▲Databricks创始团队,Stoica为左(zuo)数第(di)二位(图源:Databricks)
2009年,Databricks的创始(shi)团队开发(fa)出开源分布(bu)式大数据处理框(kuang)架Spark,并不断维护、更新(xin)这一(yi)项目,还(hai)一(yi)度创下了数据排序速度的世界(jie)纪录。
在将Spark作(zuo)为开源(yuan)项(xiang)目运营(ying)一(yi)段时间后,Databricks的联合创始人(ren)、UCB副教授的Matei Zaharia称,Stoica希(xi)望将Spark变成一(yi)家初(chu)创公司,以鼓励用户更认真(zhen)地对待此类(lei)来自高校实验室的研(yan)究。
2013年,Databricks正式成(cheng)(cheng)立(li)。凭借着开源项(xiang)目Spark的(de)(de)成(cheng)(cheng)功,Databricks在A轮融资(zi)(zi)时便获得来自a16z的(de)(de)1400万美元融资(zi)(zi)。2013年-2016年,Stoica担任Databricks CEO一职,深度参与公司日常(chang)管(guan)理与决策。
他(ta)在2016年将CEO一职交棒(bang)给了曾在AMP实验室(shi)担任(ren)访问学者的Ali Ghodsi。对(dui)于这(zhei)一决(jue)定,他(ta)在接受《福布斯》采访时说道:“超(chao)过这(zhei)个时间(jian)就意味(wei)着离开伯克(ke)利,所以我(wo)必须做(zuo)出选择,我(wo)选择了回(hui)去。”
如今(jin),Databricks已经成长为估值超(chao)过1000亿美元的超(chao)级独角兽(shou),服务(wu)超(chao)过60%的财(cai)富500强企(qi)业。Stoica仍在(zai)这一公司担任董事会执(zhi)行主席的职务(wu)。

▲Stoica担任Databricks董事会执行主席(图源:Databricks)
Alluxio(总融资额7300万美元,估值暂未披露)
Alluxio原名Tachyon,是一个(ge)以(yi)内(nei)存为(wei)中(zhong)心、容错的(de)虚(xu)拟分布式(shi)存储(chu)系统,旨在解决(jue)Apache Spark生态系统内(nei)的(de)数据共享挑(tiao)战。
2015年,Alluxio正式成(cheng)立,早期投(tou)资者(zhe)为a16z——这(zhei)是一家与Stoica关系(xi)密切(qie)的投(tou)资机构(gou)。其创(chuang)始人(ren)兼CEO李(li)浩源在AMPLab完(wan)成(cheng)了相关研(yan)究,论文指导(dao)者(zhe)便包括其博士(shi)生导(dao)师(shi)Stoica。

▲Alluxio目前(qian)的管理团(tuan)队,上排(pai)左一为(wei)李浩源(图源:Alluxio官(guan)网)
随着技术趋势(shi)转向混合云和多云架构以及AI,Alluxio不断发展(zhan),为AI和数(shu)据密集型工作负载的数(shu)据访问提(ti)供(gong)解决方案。如今(jin),Alluxio的AI加速平(ping)台为全球十大(da)互联(lian)网公司中的九家提(ti)供(gong)支(zhi)持。
Alluxio已(yi)经完(wan)成(cheng)4轮融资,其(qi)(qi)最近一轮融资于2021年底完(wan)成(cheng),由高瓴创(chuang)投(tou)领投(tou),融资额达5000万美(mei)元。不(bu)过,其(qi)(qi)估值暂时未对外披露。
Mesosphere/D2iQ(总融资2.5亿美元,最高估值7.75亿美元)
Mesosphere成(cheng)立于2013年,Stoica的学(xue)生Benjamin Hindman在(zai)其中担任(ren)CIPO(首席知识产权(quan)官(guan))的职(zhi)务。这(zhei)家公(gong)司的主要技(ji)术来自(zi)于开源项目Apache Mesos,而Benjamin Hindman是这(zhei)一项目的核心(xin)作者。
DCOS(数据(ju)中心(xin)操作系统(tong))是Mesosphere的(de)核心(xin)产品。Mesosphere将数据(ju)中心(xin)抽象(xiang)为“单一大机器(qi)”,通过分布式内核调度和资源(yuan)管理,为大规模(mo)计算与数据(ju)密集型工作负载提(ti)供统(tong)一的(de)运行平台。
2015年,Mesosphere宣布获得a16z等顶级(ji)(ji)风投的投资。随(sui)着容器(qi)化、微(wei)服(fu)务和云原生趋势的兴起,Mesosphere后续(xu)在(zai)产品上逐(zhu)渐转(zhuan)型,支持Kubernetes,并在(zai)2019年正式更名(ming)为D2iQ。D2iQ的解决方案主要面向混合云与(yu)企业(ye)级(ji)(ji)Kubernetes平(ping)台,帮助客(ke)户简化云原生应(ying)用(yong)的部署与(yu)运(yun)维。
迄今为止,D2iQ融资(zi)总额接(jie)近(jin)2.5亿美(mei)元,投资(zi)方包(bao)括a16z、Khosla创(chuang)投、惠(hui)普等,其估值曾经(jing)在2018年完成的(de)D轮(lun)融资(zi)后(hou)达到7.75亿美(mei)元。微(wei)软(ruan)、谷歌等都曾传出有收购D2iQ的(de)意向,但因D2iQ管(guan)理层(ceng)反对而未能完成交易(yi)。
2023年底,D2iQ宣布终止运(yun)营,公司资产将(jiang)进行清盘,并(bing)分配(pei)给(ji)债权人。
三、指导高性能分布式执行框架Ray科研,衍生创企估值已达10亿美元
2017年(nian)初(chu),Stoica参(can)与到(dao)了UCB RISE(实(shi)(shi)时智能安全(quan)执(zhi)行(xing))实(shi)(shi)验室的(de)创(chuang)建与管理(li)工作中。当时,Stoica等人已经意识到(dao),数据生成、计(ji)算和执(zhi)行(xing)之间的(de)循环正在闭合,AI已成现(xian)实(shi)(shi),计(ji)算的(de)影(ying)响正在扩展到(dao)世界的(de)每一个角落。
RISE实验室与AMP实验室一脉相(xiang)承,期望能(neng)在大(da)数据分析的基础上,进(jin)(jin)一步发(fa)展相(xiang)关技术(shu)栈,帮助(zhu)应用程(cheng)序(xu)实时地(di)、智能(neng)地(di)且(qie)安全地(di)与环境进(jin)(jin)行交互。
在(zai)大规模机器学习和强(qiang)化学习领(ling)域,RISE实验室贡献(xian)了超41个开源项(xiang)(xiang)目,其(qi)中影响力最大的当属高性能分(fen)布(bu)式(shi)执行(xing)框架Ray,这一(yi)项(xiang)(xiang)目成功转化为创(chuang)企Anyscale。
Anyscale(总融资2.59美元,估值10亿美元)
2019年,Anyscale成立,创始团队包括(kuo)Stoica、Philipp Moritz(Stoica的(de)博士生(sheng))和Robert Nishihara等人。Stoica目前在(zai)Anyscale担(dan)任董事(shi)会(hui)执行(xing)主席(xi)的(de)职位。
Philipp Moritz和Robert Nishihara是(shi)Ray的(de)主(zhu)要作(zuo)(zuo)者(zhe)(zhe),这一项目大(da)幅度提升了分布式计算的(de)易用(yong)性,让开(kai)发者(zhe)(zhe)能够(gou)用(yong)简单的(de)API,把单机Python程序扩展到大(da)规(gui)模分布式环境。Stoica指导(dao)这两位作(zuo)(zuo)者(zhe)(zhe)完成(cheng)了Ray的(de)相关研(yan)究。

▲Stocia与Anyscale其(qi)他联合(he)创始人的合(he)影(图源(yuan):Anyscale官(guan)网)
Ray提供了(le)统一的编程方式(shi),开发(fa)者(zhe)不(bu)必关心底(di)层分布(bu)式(shi)细节。相比于传统的Spark、Hadoop,Ray更灵活,支(zhi)持低(di)延迟的任务调度(du)和多种计算模式(shi)(批处理、流(liu)式(shi)、在线推理等)。
这一项(xiang)目在AI/ML领域(yu)影响(xiang)力尤其大,业内(nei)许多流行的库都是基于Ray构建的,如Ray Tune超参数(shu)调优框架、Ray RLlib强化(hua)学习库等。
在此(ci)基础上,Anyscale为(wei)Ray提供了完全托管计算平台(tai),添(tian)加了优化、可观察性、数据(ju)治理和开发人(ren)员工具等(deng),使其(qi)成为(wei)运行Ray工作负载的最(zui)佳平台(tai)之一。
目前,Uber、OpenAI、Shopify和亚马逊等(deng)头部企业的(de)开发人员正在使用Ray构建机(ji)器学习平台。Anyscale成(cheng)立6年(nian)来共完成(cheng)4轮融资(zi),总(zong)融资(zi)额达2.59亿(yi)美元。2022年(nian)完成(cheng)C轮融资(zi)后,其最新估值为10亿(yi)美元。
四、实验室3年贡献52个项目,帮大模型造擂台、记忆库
2022年,Stoica又推动了天(tian)空计(ji)算实验室(Sky Computing Lab)的(de)(de)成立。天(tian)空计(ji)算是云平台之上(shang)的(de)(de)一(yi)层,其目标是实现(xian)云之间的(de)(de)相互协作,让(rang)应用程序能够在任(ren)何云提供商上(shang)实现(xian)“一(yi)次写入,随处运行”。
天空(kong)计算(suan)实验室近年来已经(jing)贡献了(le)52个项目(mu),打造了(le)本(ben)轮生成(cheng)式AI浪潮(chao)中(zhong)重要的(de)基础设施,包括(kuo)大(da)模型推理引(yin)擎(qing)vLLM、AI作业框架(jia)SkiPilot、大(da)模型评(ping)估(gu)平台Chatbot Arena(现(xian)名LMArena)、视(shi)频生成(cheng)模型评(ping)估(gu)平台Video Arena、智能体记(ji)忆系统MemGPT等,其中(zhong),LMArena和MemGPT已经(jing)实现(xian)公司化运作。
LMArena(总融资1亿美元,估值6亿美元)
LMArena由Stoica和他的学生(sheng)Wei-Lin Chiang、Anastasasios N. Angelopoulos等人联合创办,Stoica担任LMArena的董事长。
这一平台通过(guo)“人(ren)类偏好(hao)投(tou)票”方式,公开评估大语言模(mo)(mo)型性能(neng)。当(dang)用户(hu)在这一平台上提交提示(shi)词后,会(hui)有两个匿名模(mo)(mo)型作答,然后基于(yu)用户(hu)选择判断哪个模(mo)(mo)型表现更佳(jia)。LMArena的数据与(yu)排行榜广受业界关注,甚至成(cheng)为不少模(mo)(mo)型发(fa)布(bu)前(qian)的重要(yao)参考。
目前,LMArena托管了400多个AI模型,平台用户投票数达到350多万张(zhang)。今年年初,LMArena完(wan)成1亿美元的种子轮融资,领(ling)投机(ji)构为a16z,投后估值达6亿美元。
融资完成后,LMArena团队发布了(le)全新设(she)计的平台,优(you)化了(le)界面和投票流(liu)程,并逐步加入(ru)登录、聊天记录保(bao)存、WebDev Arena等(deng)功能模块。
Letta(总融资1000万美元,估值7000万美元)
Letta成立于2024年,由天空计算(suan)实验室的两位(wei)博士生(sheng)Sarah Wooders和Charles Packer创(chuang)办(ban)。其中,Stoica是(shi)Sarah Wooders的博士生(sheng)导师,并在该公司担任顾问(wen)。

▲Letta创始团队(图源:Letta)
Letta的核心(xin)技术源(yuan)自MemGPT,后者是天空计算实验(yan)室的一个开(kai)源(yuan)项目(mu)。MemGPT提(ti)出了(le)“大(da)(da)模(mo)(mo)型操作系统”的概念,专注于大(da)(da)模(mo)(mo)型的上下文管理和长期记忆能(neng)力(li),让大(da)(da)模(mo)(mo)型变得“有(you)状态”(Stateful)。
2023年10月,MemGPT项(xiang)(xiang)目(mu)在正(zheng)式(shi)发布(bu)论文和代码之前,就凭借(jie)一份(fen)白皮书迅(xun)速走红。该(gai)项(xiang)(xiang)目(mu)正(zheng)式(shi)发布(bu)在GitHub上后,已(yi)经(jing)收获1.8万星标(biao)收藏,有近2000个分支项(xiang)(xiang)目(mu)。
Letta目前的(de)主要产品包括Letta云(打造和(he)部署有状态Agent的(de)云平台)和(he)用于增强Agent处理外部文(wen)件(jian)能力的(de)Letta文(wen)件(jian)系统。
2024年9月,Letta获得1000万美元(yuan)种子轮(lun)融资,估值达7000万美元(yuan)。
五、靠拉赞助和创业反哺科研,80多名学生从中受益
Stoica过去15年(nian)内主(zhu)持工作的(de)(de)三所实验室,拥(yong)有不(bu)少(shao)共同的(de)(de)特点:开源、前沿、与产业密切结合。这(zhei)些特点让(rang)它们(men)不(bu)止停(ting)留在学术(shu)机构的(de)(de)层面,还拥(yong)有孵化器(qi)般(ban)的(de)(de)能力。
自2011年的AMP实(shi)验(yan)室(shi)(shi)以来,Stoica就特(te)别注重与产业界的密(mi)切(qie)合作(zuo)。AMP实(shi)验(yan)室(shi)(shi)拉来了(le)谷歌(ge)、SAP、亚马逊、华为、IBM、英特(te)尔、微软(ruan)、VMWare等企业作(zuo)为赞助(zhu)商。
此后,Stoica的实验室还获得(de)了英(ying)伟达、Meta、蚂(ma)蚁集团、AMD、博通、三星(xing)、Lambda等(deng)企业的支持(chi)。
同时,通过不断创业,Stoica的创业项目还(hai)使他成(cheng)为了亿(yi)万富翁,现资产大约(yue)有25亿(yi)美元,他将(jiang)一部(bu)分个人资产投入实验室的运营工作中。
这些真金(jin)白银的支持让Stoica的实验室拥有资金(jin)和资源,得以同(tong)时开展大量研(yan)究项(xiang)目。
目前,Stoica在(zai)(zai)UCB担任研(yan)究(jiu)资金(jin)削减(jian)问(wen)题工作组的(de)主席。他鼓励其(qi)他教(jiao)授向他一样通过创业获取(qu)资金(jin),在(zai)(zai)美国政(zheng)府削减(jian)科(ke)研(yan)资助的(de)大背景(jing)下继续科(ke)研(yan)。
但(dan)(dan)成为亿万富(fu)翁并非Stoica的目标。Stoica在接受《福(fu)布(bu)斯》采访时称:“我仍然是一名学(xue)者,如果赚钱是唯一的驱动力,那我就去IPO了。这(zhei)是最(zui)简单的方(fang)法,但(dan)(dan)我不是出于这(zhei)一目的而(er)创(chuang)业(ye),我想创(chuang)造有(you)意义的东西(xi)。”
他还(hai)认为,自(zi)己在(zai)创(chuang)业(ye)中获得(de)的(de)成功,得(de)益(yi)于对科研的(de)专注:“这是一种创(chuang)造的(de)过(guo)程,不(bu)断探索新想法。”此外,大学的(de)科研项(xiang)(xiang)目大多具有开(kai)源性质,能吸引(yin)企业(ye)使用,而(er)大部(bu)分公司不(bu)会开(kai)源最(zui)佳系统(tong)。基于开(kai)源项(xiang)(xiang)目打造的(de)企业(ye),在(zai)起步阶段就能获得(de)不(bu)少声量(liang)。
将Stoica留(liu)在(zai)学术界(jie)的(de)原因,可能(neng)是他(ta)的(de)学生们。他(ta)向《福布(bu)斯(si)》说道(dao)(dao):“这些处在(zai)成(cheng)(cheng)长期(qi)的(de)年轻人不(bu)知道(dao)(dao)什么做的(de)成(cheng)(cheng),什么做不(bu)成(cheng)(cheng),但他(ta)们有信念(nian),能(neng)做出让人出乎意料的(de)解决方案。”
由Stoica亲自指导的(de)80多(duo)名(ming)(ming)学(xue)生(sheng)(sheng)从他(ta)(ta)的(de)资源和关系网(wang)中受(shou)益,他(ta)(ta)们绝大多(duo)数都在(zai)学(xue)术界(jie)、大公司就职,或是拥有自己的(de)初创公司,其(qi)中包括在(zai)Databricks工作的(de)至少7名(ming)(ming)学(xue)生(sheng)(sheng)。
结语:高校前沿探索仍有望转化为巨大商业价值
当今(jin)的(de)AI浪潮中,有越来(lai)(lai)越多颇具影响(xiang)力的(de)成果,诞生(sheng)在(zai)产业界(jie),这也让外界(jie)一度怀疑:在(zai)计算资源(yuan)要求越来(lai)(lai)越高(gao)、规模(mo)效(xiao)应越来(lai)(lai)越强烈的(de)AI领域,学(xue)术界(jie)的(de)价值何在(zai)?
而(er)Stoica教(jiao)授的(de)(de)成功经历证(zheng)明,在高校进行的(de)(de)开源、前沿探索项(xiang)目,往(wang)(wang)往(wang)(wang)能对产业界起到(dao)极(ji)为(wei)重要的(de)(de)补充和启(qi)发(fa)性作用。在以适当的(de)(de)方式(shi)转化(hua)为(wei)企业后,仍然可以贡献巨大的(de)(de)产业和商业价(jia)值。