DeepSeek发布文字生成图片模型Janus-Pro 测试优于OpenAI|有图
撰文: 朱加樟
出版:更新:
国产大模型DeepSeek轰动全球,造成美国股市震荡,科技公司英伟达(Nvidia,又译辉达)股价在美国当地时间27日单日暴跌近17%,市值损失创纪录的5,890亿美元。
28日凌晨,DeepSeek在GitHub平台发布了Janus-Pro多模态大模型,进军文字生成图片领域。根据其发布的测试结果,Janus-Pro在使用文本提示的图像生成排行榜中击败了Stability AI的Stable Diffusion和OpenAI的DALL-E 3。
DeepSeek方面表示,该款大模型是2024年11月13日发布的JanusFlow大模型的高级版本。相比前一代模型,Janus-Pro优化了训练策略、扩展了训练数据,模型也更大。通过这些改进,Janus-Pro 在多模态理解和文本到图像的指令跟踪功能方面都取得了重大进步,同时还增强了文本到图像生成的稳定性。
根据DeepSeek发布的测试结果,Janus-Pro在GenEval和DPG-Bench基准测试中击败了 Stable Diffusion和OpenAI的DALL-E 3。目前,Janus系列的4款模型已经开源。
可识别图片认出西湖
作为一个多模态模型,Janus-Pro不仅可以文生图,同样也能对图片进行描述,识别地标景点(例如杭州的西湖),识别图像中的文字,并能对图片中的知识(例如下图中的Tom and Jerry蛋糕)进行介绍。
DeepSeek|85后创办人梁文锋经历曝光 用AI炒股掌千亿私募基金DeepSeek香港免费使用 适应广东话口语 149秒解考评局推理题DeepSeek传死机 公司:遭大规模恶意攻击 暂仅容许内地手机注册DeepSeek│《黑悟空》制作人冯骥数6优点 盛赞:国运级别科技成果DeepSeek|北京子公司52个岗位招聘最高月薪9万 实习生日薪千元DeepSeek震散美股 Nvidia泻一成 纳指挫逾600点失守两万关DeepSeek登顶美国App下载榜震撼矽谷 美媒:Meta组建4小组研究中国新AI大模型DeepSeek强在哪里?基准测试排名升至全类别第3位