Llama3开源深夜发布,7B和70B
图3他们团队做了一个全新的高质量评估集,里面包含 1800 个提示,涵盖 12 个关键用例,分别是:寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、塑造角色\\\\/角色、开放式问答、推理、重写和总结。最骚的是,为了防止过拟合,甚至Llama3自己的建模的团队事先都不知道这玩意。然后针对 Claude Sonnet、Mistral Medium 和 GPT-3.5,对这些类别和提示进行人工评估,得到的结果,可以看到它多强
但上下文长度只有8K,知识库更新只是2023年3月(7B)和12月(70B)
代码能力超强













会员专属








没有回复内容