激光网
当前位置: 首页 > 业界 > 正文

OpenAI聘请谷歌的Todd Underwood领导站点可靠性工程团队

2023-11-27 10:31:17  来源:激光网原创    

  OpenAI 聘请了 Todd Underwood 来领导一个新的站点可靠性工程团队,专注于研究和培训工作负载。

  Underwood说,这家生成式人工智能公司已经有一个SRE团队,负责推理和API产品。

  顾名思义,SRE 的任务是构建和维护高度可靠和可扩展的软件系统。这个概念起源于谷歌,但后来传播到整个IT行业。

  “在谷歌,我创建了机器学习站点可靠性工程组织,”安德伍德在LinkedIn上说。“我们于 2016 年创立了它。

  “重组后,这些团队被拆分,我去从事资本工程工作......最近,我真的很想回到更多的 SRE 工作,但也想更接近 ML 基础设施,尤其是训练基础设施。因此,OpenAI!

  Underwood 在谷歌工作了 14 年零 9 个月,是 O'Reilly 著作《可靠的机器学习》的合著者。

  在他的帖子中,Underwood补充道:“我现在能够以某种有趣的规模建立一个新的ML训练基础设施团队。

  “这是一个需要从头开始参与到模型的基础设施的团队,有机会从事加速器的硬件健康、作业编排和执行、模型动态,当然还要特别关注指标和测量。”

  安德伍德上周在首席执行官山姆·奥特曼被解雇的混乱中加入了这家ChatGPT公司,并且是签署一封信的人之一,信中威胁说,如果他不被重新雇用,他将辞职并加入微软。五天后,Altman 回到了 OpenAI。

  “我会说,这是一次比我在任何工作中都更有趣的入职培训,”安德伍德说。“完整的故事可能需要一杯饮料和一个轻松的环境。

  那一周,OpenAI还聘请了谷歌TPU AI芯片的前负责人来领导一个新的硬件部门。

免责声明: 激光网遵守行业规则,本站所转载的稿件都标注作者和来源。 激光网原创文章,请转载时务必注明文章作者和来源“激光网”, 不尊重本站原创的行为将受到激光网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:133 467 34 45@qq.com