> 文章列表 > 豆包大模型发布各领域技术进展,首次披露 300 万长文本能力!

豆包大模型发布各领域技术进展,首次披露 300 万长文本能力!

豆包大模型发布各领域技术进展,首次披露 300 万长文本能力!

豆包模型发布各领域技术进展!字节跳动旗下的豆包大模型于12月30日公布了2024年全领域的技术进展。自5月15日首次亮相以来,该模型在通用语言、视频生成、语音对话、视觉理解等方面的能力已经跻身国际第一梯队。

豆包大模型发布各领域技术进展,首次披露 300 万长文本能力!

截至2024年12月,最新版的豆包通用模型Doubao-pro-1215综合能力较5月提升了32%,已全面对齐GPT-4o,并在数学、专业知识等部分复杂场景任务中表现更佳。其推理服务价格仅为GPT-4o的八分之一。通过海量数据优化及模型架构创新,包括提升模型稀疏度和引入强化学习,该模型的理解精度和生成质量得到了大幅提升。

豆包还首次披露了其大模型具备300万字窗口的长文本处理能力,能够一次轻松阅读上百篇学术报告,每百万tokens处理延迟仅15秒。这背后的技术包括上下文关联数据算法STRING等,这些技术显著增强了LLM利用海量外部知识的能力,并通过稀疏化及分布式方案将时延降至十秒级。