会议期间,京东集团高级副总裁、京东集团
作为企业运营的日常工作之一,在持续推进
这是一个480B参数激活35B参数的MoE模型,原生支持256Ktoken的上下文并可通过YaRN扩展到1Mtoken,拥有卓越的代码和Agent能力
Copyright © 2021 吠形吠声网 All Rights Reserved