Jeff Dean 是谷歌的第20号员工,2011年参与创立了 Google Brain,并在 2023 年成为 Google DeepMind 的首席科学家。Dean 的工作一直聚焦于大规模分布式系统和人工智能系统,尤其是神经网络的扩展与应用。在与伦敦大学副教授 Hannah Fry 的访谈中,他回顾了从神经网络的早期尝试到如今 AI 发展的历程。
Dean 讲述了他在 90 年代初尝试并行训练神经网络的经历,尽管当时计算能力不足,但这一经验为后来 AI 的扩展奠定了基础。2011年,与吴恩达的谈话重新激发了 Dean 对神经网络的兴趣,并最终促成了 Google Brain 的创立,专注于通过大规模分布式系统训练超大规模神经网络。
在访谈中,Dean 也提到了谷歌与 DeepMind 的收购背景,强调了强化学习与大规模监督学习的结合如何推动 AI 在游戏及其他复杂任务中的表现。特别是,Transformer 架构的引入解决了语言处理中的序列问题,使得模型并行处理大规模数据成为可能,从而提升了效率与准确性。
Dean 还分享了他提出 Gemini 作为 Google Brain 与 DeepMind 合并后多模态项目的名称,象征着两者的联合。在未来,多模态模型将进一步融合语言、图像、视频等多种输入模态,增强 AI 的感知和推理能力,推动 AI 向更加广泛和复杂的任务发展。