分享
奇绩大模型日报(6月 6日)
输入“/”快速插入内容
奇绩大模型日报(6月 6日)
用户150
用户150
用户1188
用户1188
用户5247
用户5247
用户4513
用户4513
用户5537
用户5537
用户8534
用户8534
2024年6月6日修改
推特
Udio支持音频上传:上传自己选择的音频剪辑,并使用最多2分钟的上下文,将该剪辑向前或向后扩展32秒
https://x.com/udiomusic/status/1798369297758077066
今天,我们宣布一系列更新,首先是一个面向付费用户的新实验功能——音频上传。您可以上传自己选择的音频剪辑,并使用最多2分钟的上下文,将该剪辑向前或向后扩展32秒。
音频上传极大地丰富了您的提示词汇。您可以使用音频来设置节奏和氛围,并从那里进行探索。也许您有一个很棒的开头,但不知道接下来该怎么做,或者有一个完整的混音,但缺少完美的过渡——在这两种情况下,Udio都可以提供灵感。请观看下面的视频了解一些示例(我们在这个过程中玩得很开心)。
50%
50%
Nomic-Embed-Vision:高质量、统一的图像、文本和多模态任务嵌入空间
https://x.com/nomic_ai/status/1798368463292973361
今天,每个 Nomic-Embed-Text 嵌入都变成了多模态。现推出 Nomic-Embed-Vision:
•
一个高质量、统一的图像、文本和多模态任务嵌入空间
•
性能优于 OpenAI CLIP 和 text-embedding-3-small
•
开放的权重和代码,以支持独立开发、研究和实验
•
与 @MongoDB, @llama_index, @LangChainAI, @huggingface, @awscloud, @digitalocean, @LambdaAPI 合作发布
50%
50%
AI Agentic 课程:学习如何使用 LangGraph 构建单智能体和多智能体 LLM 应用程序
https://x.com/AndrewYNg/status/1798378861337723039
全新 AI Agentic 课程!学习如何使用 LangGraph 构建单智能体和多智能体 LLM 应用程序。本短期课程由 LangChain 创始人 Harrison Chase 和 Tavily 创始人 Rotem Weiss 讲授,展示如何整合智能体搜索,以在可预测的格式中增强智能体的知识并提供以查询为中心的答案。还将学习如何实现智能体记忆以保存状态进行推理和调试,并了解如何在关键时刻通过人类参与来引导智能体。
您将从零开始构建一个智能体,然后使用 LangGraph 重新构建它,以彻底理解该框架。最后,您将构建一个复杂的论文写作智能体,结合课程中的所有学习内容。
在此报名!
https://deeplearning.ai/short-courses/ai-agents-in-langgraph/
50%
50%
Jonathan Whitaker演讲:微调的草图数学
https://x.com/HamelHusain/status/1798353336145674483
@johnowhitaker 的演讲:“微调的草图数学”非常受欢迎,以至于我们不得不加演一场!
他回答了以下问题:
•
我什么时候应该使用 LoRA?量化?GC?
•
最便宜的选项是什么?最准确的呢?
•
需要什么硬件?
•
批处理大小/上下文长度等是多少?
50%
50%