论坛上,腾讯云副总裁、腾讯云智能负责人
在谈到当前大量创业者聚焦大模型而未见S
这是一个480B参数激活35B参数的MoE模型,原生支持256Ktoken的上下文并可通过YaRN扩展到1Mtoken,拥有卓越的代码和Agent能力
Copyright © 2021 胸无大志网 All Rights Reserved