奇绩大模型日报（5月 16日）

用户150

用户1188

用户5247

用户4513

用户5537

用户887

2024年5月17日修改

资讯

李飞飞解读创业方向「空间智能」，让AI真正理解世界

https://mp.weixin.qq.com/s/okhjWPp0is0ks3e_RvJO4g

前段时间，路透社独家报道了知名「AI 教母」李飞飞正在创建一家初创公司，并完成了种子轮融资。在介绍这家初创公司时，一位消息人士引用了李飞飞在温哥华 TED 上的一次演讲，表示她在此次 TED 演讲中介绍了空间智能的概念。就在今天，李飞飞在 X 上放出了她在温哥华 TED 上的完整演讲视频。​

50%

common.docs_name - LarkCCM_Docs_Menu_Image

50%

大语言模型预训练新前沿：「最佳适配打包」重塑文档处理标准​

https://mp.weixin.qq.com/s/9iXb_sk0J5kPVUeS3CGhhw

在大型语言模型的训练过程中，数据的处理方式至关重要。传统的方法通常通过将大量文档拼接并切分成等同于模型的上下文长度的训练序列。这虽然提高了训练效率，但也常导致文档的不必要截断，损害数据完整性，导致关键的上下文信息丢失，进而影响模型学习到的内容的逻辑连贯性和事实一致性，并使模型更容易产生幻觉。AWS AI Labs 的研究人员针对这一常见的拼接-分块文本处理方式进行了深入研究， 发现其严重影响了模型理解上下文连贯性和事实一致性的能力。这不仅影响了模型在下游任务的表现，还增加了产生幻觉的风险。针对这一问题，他们提出了一种创新的文档处理策略——最佳适配打包 （Best-fit Packing），通过优化文档组合来消除不必要的文本截断，并显著地提升了模型的性能且减少模型幻觉。这一研究已被ICML 2024接收。​

50%

识别细胞也能用大模型了！清华系团队出品，已入选ICML 2024 | 开源​

https://mp.weixin.qq.com/s/lPTQsaN_kpvcTXtqEyZpPg

大模型带来的生命科学领域突破，刚刚再传新进展。来自清华系，使用大模型实现了单细胞身份识别，同时模型LangCell也正式对外开源。它不仅可以准确识别细胞身份，还具有很强的零样本分析能力，论文已被ICML 2024录⽤。​

50%

微软研究院刘铁岩：AI for Science，憧憬一个人人都可参与科学发现的未来​

https://mp.weixin.qq.com/s/G5iX0pkLIHoCMduWkjN0vA

正处于起步阶段的AI for Science被认为是科学发现的第五范式。尽管目前对于AI for Science的定义和研究方向仍有诸多讨论，但这并不妨碍AI for Science已经开始在科学发现的实践中取得令人瞩目的成果。近年来，微软研究院科学智能中心杰出首席科学家刘铁岩博士和他的团队致力于推动AI for Science的发展和应用。在这篇署名文章中，刘铁岩博士将分享他对人工智能在科学领域关键研究方向的看法 ，以及对AI for Science未来前景的展望。​

50%

行业首发多模态大模型辅助视障人士，vivo 看见 App 接入蓝心大模型​

https://www.ithome.com/0/768/466.htm

vivo 今日宣布，vivo 看见 App 全新升级，接入蓝心大模型，成为行业首款多模态大模型视觉辅助产品。在 vivo 应用商店搜索“vivo 看见”。​

50%

奇绩大模型日报（5月 16日） ​

奇绩大模型日报（5月 16日）