本期活动将在10月13日10:00开始,我们邀请到的嘉宾是朱亦博,他将在潜空间上海场进行分享。阶跃星辰(StepFun)系统负责人,曾任字节跳动 AI 基础设施负责人。朱亦博在大规模数据处理和人工智能算法优化方面有着深厚的背景和丰富的经验。阶跃星辰专注于通用大模型的研发,发布了 Step 系列通用大模型,包括千亿参数的语言大模型和多模态大模型,以及万亿参数的 MoE 语言大模型预览版。他将带来《从模型到集群硬件,关于全栈式 AI Infra 设计与搭建的思考的分享。
另一篇获奖论文“Dated Data: Tracing Knowledge Cutoffs in Large Language Models“研究了LLM的“有效截止日期”问题,提出了一种无需访问预训练数据的方法来估计不同数据集的实际有效时间点,并揭示了数据版本错位与重复数据处理导致的知识偏移问题。
第三篇论文“AI-generated text boundary detection with RoFT”提出了在文本中检测人类与AI生成部分的边界。通过测试不同边界检测算法,作者发现基于困惑度的检测方法在处理跨领域数据时更为鲁棒,指出了现有检测方法在处理特定文本特征时的局限性。
最后一篇获奖论文“Auxiliary task demands mask the capabilities of smaller language models”探讨了任务需求对小型语言模型能力评估的影响。实验表明,任务复杂度越高,小型模型表现越差,这种“需求差距”使得模型性能不能直接代表智能水平。