3月21日腾讯宣布推出自研深度思考模型混元T1正式版。
#8203;该模型以腾讯3月初发布的新一代快思考模型混元Turbo S为基座打造,是一款能秒回、吐字快、擅长超长文处理的强推理模型。
通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版与此前相比综合效果明显提升。
T1展现出非常强的适应性,并采用了Hybrid-Mamba-Transformer融合模式,有效降低计算复杂度和内存占用。此外,T1还解决了长文推理中的上下文丢失和信息依赖问题,并实现了2倍的解码速度提升。