分享
奇绩大模型日报(4月 3日)
输入“/”快速插入内容
奇绩大模型日报(4月 3日)
推特
HuggingFace发布两个用于OCR(从PDF/图像中提取文本的任务)的最大开源数据集
贡献人:
用户8534
用户8534
https://x.com/ClementDelangue/status/1775217191421350160?s=20
我们刚刚发布了两个用于OCR(从PDF/图像中提取文本的任务)的最大开源数据集。@m_olbap、@wightmanr 和团队做得非常出色!
https://huggingface.co/collections/pixparse/pdf-document-ocr-datasets-660701430b0346f97c4bc628
50%
50%
面向开发者的无服务器 LLM:部署在Cloudflare上,提供无服务器 GPU 推理
贡献人:
用户8534
用户8534
https://x.com/_philschmid/status/1775146868630032405?s=20
面向开发者的无服务器 LLM!🌪️ 我们很高兴在 @huggingface 上宣布"部署在 @Cloudflare Workers AI 上",使开发者能够轻松地使用由 Cloudflare 边缘 GPU 数据中心驱动的开放 LLM 作为无服务器 API。🚀😍 这是我们与 Cloudflare 合作伙伴关系的第一次整合。🤝
入门:
https://huggingface.co/blog/cloudflare-workers-ai
简而言之:
✅ 为我们流行的开放模型提供无服务器 GPU 推理
💰 按请求付费定价,只为使用的计算付费
🌐 由 Cloudflare 全球无服务器 GPU 网络提供支持
📚 可用模型:Llama、Gemma、Mistral 等。
🔗 集成选项:Workers AI REST API 或 Cloudflare AI SDK
我们才刚刚开始!@CloudflareDev 🤝 @huggingface 🤗☁️
50%
50%
Witten分享交互式提示工程教程:使用Anthropic API的互动式文档
贡献人:
用户8534
用户8534
https://x.com/zswitten/status/1775187565219631155?s=20
我已经迫不及待地想了六个月要更努力地推广这个了,现在 Anthropic API 正式发布了,我终于可以这样做了……交互式提示工程教程!
https://docs.google.com/spreadsheets/d/19jzLgRruG9kjUQNKtCg1ZjdD6l6weA6qRXG5zLIAhC8
…… 在我看来,这是学习提示最好、最有趣的方式。把它分享给你生活中的主题专家/数据科学家吧!
50%
50%
Notebook企业高级文档解析:5种性能出色且可以适应企业级规模的文档解析方法
贡献人:
用户8534
用户8534
https://x.com/giannis2two/status/1775208991905243499?s=20
Notebook: 企业高级文档解析
https://colab.research.google.com/drive/1xJzQdsgy6zH7H1igwT2CTx-JzgG0mCq2?usp=sharing
…
文档解析是几乎每个基于文档的RAG应用程序都必须处理的一个复杂问题。我在@cohere的团队反复问自己以下问题(续)
1) 解析文档数据最准确的方法是什么?
2) 如果我的文档是.csv、.pdf、.pptx、.png 格式怎么办?或者更糟的情况是这些格式的组合(带图片的pdf,带图片的pptx)?
3) 企业想要使用什么样的设置?他们是否受限于特定的云服务提供商?
50%
50%