北京智源推出通用视觉分割模型 SegGPT

热点资讯 2023年5月30日 pm6:46 3 来源: 奇客资讯网

北京智源人工智能研究院推出通用分割模型 SegGPT（Segment Everything In Contex），这是一个利用视觉提示（prompt）完成任意分割任务的通用视觉模型。相关代码发布在 GitHub 上，论文发表在预印本平台 arXiv 上。SegGPT 是智源通用视觉模型 Painter 的衍生模型，针对分割一切物体的目标做出优化。SegGPT 具备上下文推理能力，训练完成后无需微调，只需提供示例即可自动推理并完成对应分割任务，包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等。它的灵活推理能力支持任意数量的视觉提示。自动视频分割和追踪能力以第一帧图像和对应的物体掩码作为上下文示例，SegGPT 能够自动对后续视频帧进行分割，并且可以用掩码的颜色作为物体的ID，实现自动追踪。

文章版权归作者所有，未经允许请勿转载。

前一篇：AI 繁荣催生芯片荒

后一篇：黄仁勋称 AI 意味着人人都能成为程序员

发表回复取消回复

要发表评论，您必须先登录。

北京智源推出通用视觉分割模型 SegGPT

相关文章

发表回复 取消回复

发表回复取消回复