奇绩大模型日报（9月 24日）

用户150

用户1188

用户5537

用户481

用户8534

2024年9月27日修改

潜空间活动报名

🎉

潜空间系列活动重磅回归！

本期活动将在9月28日 10:00开始，我们邀请到的嘉宾是李卓翰。vLLM 创始人之一，加州大学伯克利分校博士生，负责 vLLM 的高层设计与开源社区管理。vLLM 作为一个开源的大模型推理加速框架，已经可以支持 30+ 生成式大语言模型，在本次分享中李卓翰将带来《vLLM: 构建高效的开源 LLM 推理引擎》的分享。​

除嘉宾分享外，每期设置了【匹配合伙人 Cofounder Matching】环节。你可以和 GenAI 时代最有活力的创业者和研究者线下面对面交流，将有机会找到志同道合、有共同创业梦想的小伙伴。​

报名通道已开启，欢迎扫描下方二维码报名。

common.docs_name - LarkCCM_Docs_Menu_Image

资讯

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑一致性​

https://mp.weixin.qq.com/s/pzn802jOIHeL0L9L_yaytw

姚期智团队提出了大语言模型（LLM）推理新框架“思维图”（DoT），对现有的链式推理（CoT）进行重要改进。该框架通过有向无环图（DAG）建模推理过程，提升了模型的推理复杂度和准确性。不同于CoT线性推理，DoT能够更好地捕捉推理中的复杂关系，并避免依赖外部控制或多个模型协作。DoT的推理过程包括三个角色：提议者、批评者和总结者，它们通过生成、批评和综合命题，完成逻辑推导。每个推理步骤通过DAG节点和边的拓扑关系建模，确保逻辑一致性和无环特性。​

DoT的核心创新在于将推理过程形式化为数学拓扑斯理论（Topos Theory），以确保逻辑推理的可靠性。与CoT相比，DoT不依赖于多个模型的协作，而是在单个模型中通过DAG实现复杂推理，降低了训练和部署的难度。每个节点表示命题或批评，边则表述节点间的依赖关系。通过自然语言的批评反馈，DoT还能让模型从错误中学习，更真实地模拟人类思维方式。​

团队利用拓扑斯理论对DoT进行了严格的数学形式化处理，模型的推理过程得到了理论上的逻辑一致性保障。这一框架不仅简化了部署流程，还为未来推理专用AI模型提供了新的设计思路。​

50%

Rabbit推出基于网络的通用大动作模型代理：跨平台操作成焦点​

https://techcrunch.com/2024/09/23/rabbits-web-based-large-action-model-agent-arrives-on-r1-as-early-as-this-week/

Rabbit公司计划于10月1日发布基于网络的通用版大动作模型（Large Action Model, LAM）代理，这一代理能够在任何网站上执行常见任务，如购买票务、注册网站、玩在线游戏等。与之前仅限于特定应用程序或服务的版本不同，此次发布的LAM能够识别屏幕上的按钮、字段和图像，并根据学习到的网页操作知识执行任务。​

该代理通过分析任务步骤并执行操作，展示出较高的自动化潜力，但依然依赖于用户的提示精度。CEO Jesse Lyu承认，虽然模型能够进行任务规划，但其在跳过不必要步骤或优化用户偏好方面仍有局限。此外，该系统并不收集用户数据来改善模型，但未来可能引入“教学模式”以帮助用户定制任务执行方式。​

Rabbit公司还在开发一个桌面版代理，旨在控制桌面应用程序，如文字处理器和音乐播放器。虽然该技术仍处于早期阶段，但目标是构建跨平台的通用AI系统，能够操作用户所有服务。​

50%

国产AI芯片行业简评

https://mp.weixin.qq.com/s/c0XFavJVlGAl0xlG8n9cbg

国产AI芯片行业呈现两极分化态势，一方面燧原科技和壁仞科技等企业逐步迈向IPO，另一方面砺算科技等公司则面临资金困境。芯片行业高投入、高风险的特点，使得“赢者通吃”的局面日益凸显。数据显示，2023年已有1.09万家中国芯片相关企业注销或吊销。​

壁仞科技等公司在美国制裁和国内政策支持下，加快了技术突破，尤其是在GPU设计方面。壁仞科技的BR100 GPU芯片和燧原科技的“邃思2.0”训练芯片均采用了高性能的设计，并在大模型训练中取得了显著进展。燧原科技通过自研架构和指令集，推出了部分兼容CUDA生态的产品，强化了芯片间的互联技术，大幅提升了集群计算的效率。​

50%

奇绩大模型日报（9月 24日） ​

奇绩大模型日报（9月 24日）