日本东京工业大学、理化学研究所、富士通等发布增强日语能力的大模型 Fugaku-LLM,移植了 Megatron-DeepSpeed 深度学习框架,源代码托管在 GitHub 上,公众可通过 Fujitsu Research Portal 网站试用。Fugaku-LLM 有 130 亿参数,日语 MT-Bench 平均分 5.5,其人文和社会科学得分高达 9.18 分。Fugaku-LLM使用了日本最强大的 ARM 超算富岳进行了训练。
前一篇:OpenAI 预计下周一发布 AI 驱动的搜索引擎
后一篇:OpenAI 发布新的免费模型 GPT-4o
要发表评论,您必须先登录。