比 ChatGPT 更强大,微软推出全能型人工智能模型 Kosmos-1
发布时间:2023-03-04 15:10:59 文章来源:IT之家
当前位置: 主页 > 资讯 > 国内 > 正文


【资料图】

3月4日消息,基于ChatGPT的必应聊天已经让不少用户感受到了AI的强大,而微软于近日推出了更为强悍的全能型AI--Kosmos-1。ChatGPT是纯文本LLM,而它是更强大的多模式大型语言模型(MLLM)。

Kosmos-1可以分析图像的内容、解决视觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等等。

从报道中获悉,Kosmos-1可以处理文本、音频、图像和视频等内容,构建一个全能型的人工智能,可以像人类思维一样来处理任务。

研究人员在他们的学术论文中写道:“作为智能的基本组成部分,多模态感知是实现人工智能的必要条件”。Kosmos-1论文中的视觉示例显示模型分析图像并回答有关图像的问题,从图像中读取文本,为图像编写标题,并以22-26%的准确度进行视觉智商测试。

微软表示,它计划向开发人员提供Kosmos-1,尽管该论文引用的GitHub页面在本文发表时没有明显的Kosmos特定代码。

标签: 人工智能 学术论文 读取文本

最近更新