奇绩大模型日报（7月 5日）

用户150

用户5537

用户1188

用户8534

用户4513

用户887

2024年7月5日修改

资讯

阿里云 CTO 周靖人：通义真正实现全尺寸、全模态开源，下载量已破 2000万​

https://www.geekpark.net/news/337601

阿里云坚持拥抱开源开放。7 月 5 日，在上海世界人工智能大会上，阿里云 CTO 周靖人公布近期通义大模型和阿里云百炼平台的最新进展。近 2 个月，通义千问开源模型下载量增长 2 倍，突破 2000 万次，阿里云百炼服务客户数从 9 万增长至 23 万，涨幅超 150%。周靖人重申了阿里云拥抱开源开放的坚定立场，「两年前，我们在世界人工智能大会上发布通义大模型系列，当时我们公布，通义核心模型将开源开放。到今天，通义千问已经实现真正意义上的全尺寸、全模态开源，拉平了开源、闭源模型之间的差距。」​

50%

common.docs_name - LarkCCM_Docs_Menu_Image

50%

现场Live震撼！OmAgent框架强势开源！行业应用已全面开花

https://mp.weixin.qq.com/s/H8etlBwce0ecql6ne9213w

OmAgent 来了！WAIC 期间，联汇科技正式发布第二代多模态智能体 OmAgent。去年同期，联汇科技抢跑行业，率先发布了国内第一批由多模态大模型驱动的自主智能体，那么，今年联汇的第二代多模态智能体 OmAgent 有哪些惊喜？首先是感知模块全新升级。随着 AI 应用落地，联汇科技发现尽管万物感知模型在智能识别和处理方面具有巨大潜力，但受限于推理速度的瓶颈。相较于小型模型在推理速度上的优势，Idealab 的 G-DINO 和联汇科技的 OmDet 在速度上的表现都不尽如人意，这极大地限制了它们在边缘计算设备上的应用。​

50%

全球首个支持单任务千卡规模异构芯片混合训练平台，来自无问芯穹​

https://mp.weixin.qq.com/s/LJNqTvDdyqlsqB98yTIuGQ

7月4日，在2024年世界人工智能大会AI基础设施论坛上，无问芯穹联合创始人兼CEO夏立雪发布了无问芯穹大规模模型的异构分布式混合训练系统，千卡异构混合训练集群算力利用率最高达到了97.6%。同时，夏立雪宣布无问芯穹Infini-AI云平台已集成大模型异构千卡混训能力，是全球首个可进行单任务千卡规模异构芯片混合训练的平台，具备万卡扩展性，支持包括AMD、华为昇腾、天数智芯、沐曦、摩尔线程、NVIDIA六种异构芯片在内的大模型混合训练。7月起，通过试训申请的用户，已可在Infini-AI上一键发起700亿参数规模的大模型训练。​

50%

ACL 2024 | 引领学术视听研究，上海交大、清华大学、剑桥大学、上海AILAB联合发布学术视听数据集M3AV​

https://mp.weixin.qq.com/s/UQ2P5AFm7yhjFm2lc70O8g

开源学术演讲录像是一种普遍流行的在线分享学术知识的方法。这些视频包含丰富的多模态信息，包括演讲者的语音、面部表情和身体动作，幻灯片中的文本和图片，和对应的论文文本信息。目前很少有数据集能够同时支持多模态内容识别和理解任务，部分原因是缺乏高质量的人工标注。该工作提出了一个新的多模态、多类型、多用途的视听学术演讲数据集（M3AV），它包含来自五个来源的近 367 小时的视频，涵盖计算机科学、数学、医学和生物学主题。凭借高质量的人工标注，特别是高价值的命名实体，数据集可以用于多种视听识别和理解任务。在上下文语音识别、语音合成以及幻灯片和脚本生成任务上进行的评估表明，M3AV 的多样性使其成为一个具有挑战性的数据集。目前该工作已被 ACL 2024 主会接收。​

50%

推特

奇绩大模型日报（7月 5日） ​

奇绩大模型日报（7月 5日）