分享
奇绩大模型日报(4月 17日)
输入“/”快速插入内容
奇绩大模型日报(4月 17日)
推特
谷歌DeepMind ALOHA Unleashed 一镜到底:通过低成本机器人和AI挑战灵巧性的极限
贡献人:
用户8534
用户8534
https://x.com/tonyzzhao/status/1780263497584230432
介绍ALOHA Unleashed - 通过低成本机器人和AI挑战灵巧性的极限。
@GoogleDeepMind
经过几个月的等待,终于可以分享一些视频了。机器人是完全自主的,并且是一镜到底拍摄的。尽情享受吧!
50%
50%
Snowflake开源snowflake-arctic-embed:一系列强大的嵌入模型
贡献人:
用户8534
用户8534
https://x.com/osanseviero/status/1780238572374655298
Snowflake刚刚开源了snowflake-arctic-embed:一系列强大的嵌入模型
•
2200万到3.35亿参数
•
384-1024嵌入维度
•
50-56 MTEB分数(在同等规模下属于SOTA)
这个组织看起来不错
https://huggingface.co/Snowflake
50%
50%
由Antonio Torralba和Bill Freeman合著的《计算机视觉基础》发布
贡献人:
用户8534
用户8534
https://x.com/phillip_isola/status/1780349596184535447
我们的计算机视觉教材发布了!由Antonio Torralba和Bill Freeman合著的《计算机视觉基础》
https://mitpress.mit.edu/9780262048972/foundations-of-computer-vision/
…
这本书酝酿了超过10年之久。涵盖了从线性滤波器和相机光学到扩散模型和辐射场的所有内容。对我来说,最有趣的部分之一是制作可视化。作为示例,这里有几个,展示了1)MLP中逐层的嵌入,2)CNN中的权重共享,3)扩散模型,4)图像字幕系统
在写这本书的过程中,这个领域发生了很大的变化。这是我们的进展图。(我在中途加入,我的第一个贡献是放慢速度...)但是试图将新旧概念联系起来很有趣。在每个时代,许多概念都会重现,形成螺旋式进步。
感谢所有为这本书提供帮助的人!如果你发现错误和需要更正的地方,请告诉我们。未来会有更多的内容在线上提供。
50%
50%
Thomas Wolf分享低成本的DJI机器人,3个本地开源AI模型控制
贡献人:
用户8534
用户8534
https://x.com/Thom_Wolf/status/1780241959036047604
是时候迎来开源AI机器人革命了!
我们一直在玩一个低成本的DJI机器人,它由3个本地开源AI模型(Whisper、Idefics2、Parler-TTS - 都是Apache2)控制,并由Dora-cs编排。
在评论中有一个250行代码的要点(gist),可以在此基础上进行构建 => 尽情享受吧!!
50%
50%