法国 AI 创业公司 Mistral AI 发布了其首个多模模型 Pixtral 12B,具有语言和视觉处理能力,它能识别图像但不能生成图像。用户可通过 Hugging Face 和 GitHub 访问其源代码,源码采用 Apache 2.0 许可,用户可以不受限制的下载、微调和使用。Pixtral 12B 有 120 亿参数,模型大小 24GB。它是基于文本模型 Nemo 12B,应该能执行为图像添加文字描述和计算照片中物体数量等任务。Mistral 没有披露使用了哪些图像去训练模型。
前一篇:在 AI 虚假信息之后 Taylor Swift 公开支持 Kamala Harris
后一篇:Google 联合创始人称他天天上班从事 AI 工作
要发表评论,您必须先登录。