奇绩大模型日报(10月 13日)
输入“/”快速插入内容
奇绩大模型日报(10月 13日)
用户150
用户150
用户3980
用户3980
用户1188
用户1188
用户5537
用户5537
用户8534
用户8534
用户8322
用户8322
2024年10月13日修改
资讯
OpenAI剽窃?20岁创始人自曝代码结构被抄袭,多智能体Swarm陷争议
https://mp.weixin.qq.com/s/LHHhMm7prS6lRcwXNccd-Q
近日,OpenAI发布了全新多智能体框架Swarm,引发了广泛关注,项目一经推出便迅速获得了4.6k星。然而,年仅20岁的Swarms Corporation创始人Kye Gomez指控OpenAI涉嫌剽窃其团队的核心技术。Gomez表示,OpenAI不仅窃取了项目名称,还抄袭了他们的代码结构和方法,侵犯了其团队的知识产权。
Gomez指出,Swarms Corporation开发的多智能体框架已经运行了近3年,拥有超过4500万个智能体在生产环境中运行,为金融、保险和医疗等行业提供服务。他警告称,除非OpenAI进行投资,否则将采取法律行动。Gomez详细列举了相似之处,包括框架名称的近似、语法规则的复制(如.run())、函数自动转换功能等方面。
OpenAI的Swarm框架通过“智能体”和“交接”来实现智能体的协调和执行,旨在打造一个轻量级、高度可控且易于测试的系统,已在开发者社区引发热议。Gomez的指控则使这一新框架的发布蒙上阴影,目前双方争议仍在发酵,公众期待看到更多证据和澄清。
50%
50%
趋境科技发布大模型知识推理一体机
https://www.qbitai.com/2024/10/199659.html
随着开源大模型的进化,推理能力在各行各业的应用不断拓展,未来的算力建设将更多聚焦于推理场景,而不仅限于训练算力。华福证券预计,到2027年,推理端AI服务器将占整体工作负载的72.6%。尽管大模型取得了显著进展,但部署数百亿参数的模型仍面临高成本和低效率的挑战。
为解决这一问题,趋境科技推出了“大模型知识推理一体机”,首创“全系统推理架构”,通过协同存储、CPU、GPU、NPU等设备,降低推理成本达10倍以上。这种架构充分利用异构算力资源,实现推理效率的突破性提升。
趋境科技的创新还包括“融合推理(Fusion Attention)”技术,通过历史信息与现场数据的融合,提升推理效率。此外,趋境科技与清华大学团队合作,推出了“KTransformers”开源框架,进一步提升了推理性能,在长上下文推理任务中表现卓越。
这一架构已成功应用于多个行业,如长亭科技通过该架构将安全大模型升级为千亿级别,大幅提升了网络安全性能,并降低了部署成本50%。
50%
50%
Anthropic CEO发布乐观主义长文,讨论AI未来及投融资动向
https://techcrunch.com/2024/10/11/anthropic-ceo-goes-full-techno-optimist-in-15000-word-paean-to-ai/
近日,Anthropic CEO达里奥·阿莫代(Dario Amodei)发布了一篇约1.5万字的长文,详细阐述了他对人工智能(AI)未来的乐观愿景。阿莫代表示,他并非“AI末日论者”,而是相信AI将在未来几年内解决许多全球性问题,包括医疗突破、世界饥饿和气候变化。
阿莫代预测,强大的AI可能在2026年问世,这种AI将能够超越诺贝尔奖得主的智能水平,执行复杂任务,如证明数学定理和撰写优秀小说。此外,他认为AI将在未来5-10年内帮助治愈PTSD、抑郁症、阿尔茨海默病等疾病,并通过AI研发的新药提升人类认知功能和情感状态。阿莫代甚至预测,人类的平均寿命可能因此翻倍,达到150岁。
尽管这些预测充满乐观色彩,但许多专家质疑AI短期内是否真的能够实现这些目标,尤其是考虑到现有AI技术在医疗领域尚未展现出颠覆性效果。阿莫代在文章中也提到,解决这些问题需要全球健康、慈善和政治领域的巨大努力。
值得注意的是,这篇文章的发布恰逢Anthropic正寻求融资的关键时期。据报道,Anthropic正计划筹集数十亿美元的风投资金。分析人士指出,阿莫代的乐观主义论调与其公司正在进行的融资可能有关,类似的情况曾在OpenAI CEO萨姆·奥特曼(Sam Altman)发布乐观主义文章后发生,紧接着OpenAI完成了65亿美元的融资。
最终,阿莫代强调,尽管AI可能带来巨大经济变革,人类仍需讨论如何调整经济结构,以应对AI接管大量工作后的社会影响。然而,他并未提出具体的解决方案。
https://darioamodei.com/machines-of-loving-grace
50%
50%
商汤“夺金”SuperCLUE-V多模态大模型基准10月榜单
https://www.qbitai.com/2024/10/199693.html
今日,SuperCLUE-V中文多模态大模型测评基准发布了10月榜单,商汤科技的商量多模态大模型(SenseChat-Vision 5.5)凭借卓越表现,总得分73.56分,跻身国内大模型第一梯队,并在数理逻辑维度超越所有参评模型,包括最新版本的GPT-4o,荣获金牌。
SuperCLUE-V的评估涵盖多维度能力,包括基础能力和应用能力,以开放式问题形式测试了11个国内外多模态大模型。商汤SenseChat-Vision 5.5在数理逻辑推理任务(如图表推理、场景推理)表现突出,显示出其强大的推理能力。
商汤科技董事长徐立博士提出的三层架构理论(知识、推理、执行)是其模型能力提升的核心策略。商汤科技的“日日新5.5”体系通过使用大量合成高阶思维链数据,显著提升了推理能力,在数理逻辑、指令跟随等方面提升了30%。
50%
50%
推特