奇绩大模型日报（9月 12日）

用户150

用户1188

用户5537

用户8534

用户5294

用户6465

2024年9月18日修改

资讯

Reader-LM：用于清理和转换HTML为Markdown的小型语言模型

https://jina.ai/news/reader-lm-small-language-models-for-cleaning-and-converting-html-to-markdown/?nocache=1

 Jina AI 推出了两款小型语言模型（SLM），Reader-LM-0.5B 和 Reader-LM-1.5B，专门用于从嘈杂的HTML中提取并生成干净的Markdown。这些模型有效地替代了传统的Readability和Turndown库，通过直接从HTML生成Markdown，解决了噪声过滤和标记转换的问题。与大模型相比，这些SLM更具成本效益，同时支持长达256K的上下文长度。​

•
任务：模型的主要任务是选择性复制HTML内容到Markdown，跳过不必要的HTML标记（如导航栏、侧边栏等），并转换为相应的Markdown语法。​

•
性能：Reader-LM在多个维度的性能表现优异，包括内容提取、Markdown语法使用和文档结构保留，甚至在某些方面超越了更大的语言模型。​

•
多语言支持：模型支持多种语言，适用于从新闻文章到电子商务页面等多种类型的网页内容转换。​

•
应用场景：这些模型已经集成到Google Colab和云平台（如Azure和AWS），用户可以通过这些平台轻松体验和使用Reader-LM进行HTML到Markdown的转换。​

1.
长上下文支持：可以处理长达256K tokens的上下文，适合处理包含大量噪声的现代HTML。​

2.
高效性：相比于传统方法，Reader-LM在准确性和效率上都有所提升，尤其在结构保留和格式转换方面表现出色。​

3.
小模型大用处：尽管参数量较小，Reader-LM仍能高效完成复杂的HTML到Markdown转换任务，且大大减少了推理时间和计算资源消耗。​

50%

common.docs_name - LarkCCM_Docs_Menu_Image

50%

Arcee-SuperNova：70B参数旗舰模型，OpenAI替代方案

https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/

Arcee-SuperNova是Arcee AI推出的旗舰70B模型，作为OpenAI迁移计划的一部分，专注于指令跟随能力和与人类偏好的高度对齐。通过使用开源工具和创新的后训练技术，Arcee-SuperNova在性能和人类偏好得分上表现出色，并且为企业提供了灵活、安全的部署选择。​

核心内容：

•
模型结构：Arcee-SuperNova由Llama-3.1-405B-Instruct的蒸馏版本构建，使用自研的DistillKit工具，保证模型在缩减参数量的同时，保留了指令跟随能力。​

•
多模型融合：最终模型结合了三种训练方法，包括指令优化模型和人类偏好优化模型，确保了性能和人类偏好的双重提升。​

•
性能表现：模型在多个基准测试中表现优异，特别是在数学查询、推理和知识检索方面，优于其他70B模型。其人类偏好得分接近405B-Instruct模型，大幅提升了用户体验。​

部署和客户集成：

•
数据隐私：SuperNova的一个显著优势是完全在客户的私有环境中托管，保证数据隐私。客户拥有模型权重，且所有更新都需客户同意。​

•
灵活性和定制化：支持通过人类反馈强化学习（RLHF）对模型进行持续训练，使其更符合客户的业务需求。企业还可以根据特定任务对模型进行定制训练，确保其在关键任务上的卓越表现。​

50%

机房锂电池火灾致阿里字节服务瘫痪，超 30 小时灭火仍未结束​

https://mp.weixin.qq.com/s/pYCVlNB4QnZBy1t250rvLw

2024年9月10日，阿里云位于新加坡可用区C的数据中心发生火灾，起因是锂电池爆炸，火灾持续超过30小时，导致主要科技公司服务中断。受影响的关键云产品包括Redis、MongoDB、RDS MySQL、OSS、OTS和MaxCompute。阿里云表示，部分服务已恢复，但仍有业务因机房断电未恢复。Lazada、TikTok Shop等平台因系统故障影响订单同步，用户反馈服务中断。消防员持续进行灭火，火灾引发的安全隐患增加了救援难度。​

50%

字节Loopy、CyberHost研究成果

https://mp.weixin.qq.com/s/sf_fmjDUOaQXD7BbovaY5A

字节跳动近期推出的视频生成模型Loopy引发广泛关注。Loopy基于Diffusion视频生成框架，能够通过输入一张图片和音频生成高保真的肖像视频，展现出呼吸、叹气等自然动作和情绪细节。Loopy引入了inter/intra-clip temporal layers模块，用以捕捉跨时间片段及单片段内的时序信息，并通过Temporal Segment Module强化对长时运动的捕捉。音频驱动生成时，Loopy使用了A2L模块，将音频、表情和运动参数转化为motion latents，实现细腻自然的人像表情生成。​

此外，字节跳动还推出了半身人像生成模型CyberHost，其通过Codebook Attention模块强化了对人脸和手部的结构先验学习，解决了纯音频驱动下手部动作生成的难题。通过Body Movement Map和Hand Clarity Score等机制，CyberHost进一步提升了人体和手部动作生成的质量。​

50%

奇绩大模型日报（9月 12日） ​

奇绩大模型日报（9月 12日）