豆包大模型发布各领域技术进展，首次披露 300 万长文本能力！

文章列表

豆包大模型发布各领域技术进展！字节跳动旗下的豆包大模型于12月30日公布了2024年全领域的技术进展。自5月15日首次亮相以来，该模型在通用语言、视频生成、语音对话、视觉理解等方面的能力已经跻身国际第一梯队。

豆包大模型发布各领域技术进展，首次披露 300 万长文本能力！

截至2024年12月，最新版的豆包通用模型Doubao-pro-1215综合能力较5月提升了32%，已全面对齐GPT-4o，并在数学、专业知识等部分复杂场景任务中表现更佳。其推理服务价格仅为GPT-4o的八分之一。通过海量数据优化及模型架构创新，包括提升模型稀疏度和引入强化学习，该模型的理解精度和生成质量得到了大幅提升。

豆包还首次披露了其大模型具备300万字窗口的长文本处理能力，能够一次轻松阅读上百篇学术报告，每百万tokens处理延迟仅15秒。这背后的技术包括上下文关联数据算法STRING等，这些技术显著增强了LLM利用海量外部知识的能力，并通过稀疏化及分布式方案将时延降至十秒级。

豆包大模型发布各领域技术进展，首次披露 300 万长文本能力！

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签

豆包大模型发布各领域技术进展，首次披露 300 万长文本能力！

相关问题

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签