分享
奇绩大模型日报(9月 24日)
输入“/”快速插入内容
奇绩大模型日报(9月 24日)
用户150
用户150
用户1188
用户1188
用户5537
用户5537
用户481
用户481
用户8534
用户8534
+3
2024年9月27日修改
潜空间活动报名
🎉
潜空间系列活动重磅回归!
本期活动将在
9月28日
10:00
开始,我们邀请到的嘉宾是
李卓翰。
vLLM 创始人之一,加州大学伯克利分校博士生,负责 vLLM 的高层设计与开源社区管理。vLLM 作为一个开源的大模型推理加速框架,已经可以支持 30+ 生成式大语言模型,在本次分享中李卓翰将带来
《vLLM: 构建高效的开源 LLM 推理引擎》
的分享。
除嘉宾分享外,每期设置了【匹配合伙人 Cofounder Matching】环节。你可以和 GenAI 时代最有活力的创业者和研究者线下面对面交流,将有机会找到志同道合、有共同创业梦想的小伙伴。
报名通道已开启,欢迎扫描下方二维码报名。
资讯
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致性
https://mp.weixin.qq.com/s/pzn802jOIHeL0L9L_yaytw
姚期智团队提出了大语言模型(LLM)推理新框架“思维图”(DoT),对现有的链式推理(CoT)进行重要改进。该框架通过有向无环图(DAG)建模推理过程,提升了模型的推理复杂度和准确性。不同于CoT线性推理,DoT能够更好地捕捉推理中的复杂关系,并避免依赖外部控制或多个模型协作。DoT的推理过程包括三个角色:提议者、批评者和总结者,它们通过生成、批评和综合命题,完成逻辑推导。每个推理步骤通过DAG节点和边的拓扑关系建模,确保逻辑一致性和无环特性。
DoT的核心创新在于将推理过程形式化为数学拓扑斯理论(Topos Theory),以确保逻辑推理的可靠性。与CoT相比,DoT不依赖于多个模型的协作,而是在单个模型中通过DAG实现复杂推理,降低了训练和部署的难度。每个节点表示命题或批评,边则表述节点间的依赖关系。通过自然语言的批评反馈,DoT还能让模型从错误中学习,更真实地模拟人类思维方式。
团队利用拓扑斯理论对DoT进行了严格的数学形式化处理,模型的推理过程得到了理论上的逻辑一致性保障。这一框架不仅简化了部署流程,还为未来推理专用AI模型提供了新的设计思路。
50%
50%
Rabbit推出基于网络的通用大动作模型代理:跨平台操作成焦点
https://techcrunch.com/2024/09/23/rabbits-web-based-large-action-model-agent-arrives-on-r1-as-early-as-this-week/
Rabbit公司计划于10月1日发布基于网络的通用版大动作模型(Large Action Model, LAM)代理,这一代理能够在任何网站上执行常见任务,如购买票务、注册网站、玩在线游戏等。与之前仅限于特定应用程序或服务的版本不同,此次发布的LAM能够识别屏幕上的按钮、字段和图像,并根据学习到的网页操作知识执行任务。
该代理通过分析任务步骤并执行操作,展示出较高的自动化潜力,但依然依赖于用户的提示精度。CEO Jesse Lyu承认,虽然模型能够进行任务规划,但其在跳过不必要步骤或优化用户偏好方面仍有局限。此外,该系统并不收集用户数据来改善模型,但未来可能引入“教学模式”以帮助用户定制任务执行方式。
Rabbit公司还在开发一个桌面版代理,旨在控制桌面应用程序,如文字处理器和音乐播放器。虽然该技术仍处于早期阶段,但目标是构建跨平台的通用AI系统,能够操作用户所有服务。
50%
50%
国产AI芯片行业简评
https://mp.weixin.qq.com/s/c0XFavJVlGAl0xlG8n9cbg
国产AI芯片行业呈现两极分化态势,一方面燧原科技和壁仞科技等企业逐步迈向IPO,另一方面砺算科技等公司则面临资金困境。芯片行业高投入、高风险的特点,使得“赢者通吃”的局面日益凸显。数据显示,2023年已有1.09万家中国芯片相关企业注销或吊销。
壁仞科技等公司在美国制裁和国内政策支持下,加快了技术突破,尤其是在GPU设计方面。壁仞科技的BR100 GPU芯片和燧原科技的“邃思2.0”训练芯片均采用了高性能的设计,并在大模型训练中取得了显著进展。燧原科技通过自研架构和指令集,推出了部分兼容CUDA生态的产品,强化了芯片间的互联技术,大幅提升了集群计算的效率。
50%
50%