奇绩大模型日报（6月 6日）

用户150

用户1188

用户5247

用户4513

用户5537

用户8534

2024年6月6日修改

推特

Udio支持音频上传：上传自己选择的音频剪辑，并使用最多2分钟的上下文，将该剪辑向前或向后扩展32秒​

https://x.com/udiomusic/status/1798369297758077066

今天，我们宣布一系列更新，首先是一个面向付费用户的新实验功能——音频上传。您可以上传自己选择的音频剪辑，并使用最多2分钟的上下文，将该剪辑向前或向后扩展32秒。​

音频上传极大地丰富了您的提示词汇。您可以使用音频来设置节奏和氛围，并从那里进行探索。也许您有一个很棒的开头，但不知道接下来该怎么做，或者有一个完整的混音，但缺少完美的过渡——在这两种情况下，Udio都可以提供灵感。请观看下面的视频了解一些示例（我们在这个过程中玩得很开心）。​

50%

Nomic-Embed-Vision：高质量、统一的图像、文本和多模态任务嵌入空间​

https://x.com/nomic_ai/status/1798368463292973361

今天，每个 Nomic-Embed-Text 嵌入都变成了多模态。现推出 Nomic-Embed-Vision：​

•
一个高质量、统一的图像、文本和多模态任务嵌入空间​

•
性能优于 OpenAI CLIP 和 text-embedding-3-small​

•
开放的权重和代码，以支持独立开发、研究和实验​

•
与 @MongoDB, @llama_index, @LangChainAI, @huggingface, @awscloud, @digitalocean, @LambdaAPI 合作发布​

50%

 AI Agentic 课程：学习如何使用 LangGraph 构建单智能体和多智能体 LLM 应用程序​

https://x.com/AndrewYNg/status/1798378861337723039

全新 AI Agentic 课程！学习如何使用 LangGraph 构建单智能体和多智能体 LLM 应用程序。本短期课程由 LangChain 创始人 Harrison Chase 和 Tavily 创始人 Rotem Weiss 讲授，展示如何整合智能体搜索，以在可预测的格式中增强智能体的知识并提供以查询为中心的答案。还将学习如何实现智能体记忆以保存状态进行推理和调试，并了解如何在关键时刻通过人类参与来引导智能体。​

您将从零开始构建一个智能体，然后使用 LangGraph 重新构建它，以彻底理解该框架。最后，您将构建一个复杂的论文写作智能体，结合课程中的所有学习内容。​

在此报名！https://deeplearning.ai/short-courses/ai-agents-in-langgraph/

50%

Jonathan Whitaker演讲：微调的草图数学

https://x.com/HamelHusain/status/1798353336145674483

@johnowhitaker 的演讲：“微调的草图数学”非常受欢迎，以至于我们不得不加演一场！​

他回答了以下问题：

•
我什么时候应该使用 LoRA？量化？GC？​

•
最便宜的选项是什么？最准确的呢？​

•
需要什么硬件？​

•
批处理大小/上下文长度等是多少？​

50%

common.docs_name - LarkCCM_Docs_Menu_Image

50%

奇绩大模型日报（6月 6日） ​

奇绩大模型日报（6月 6日）