DeepSeek发布Janus-Pro图像生成模型 70亿参数打造击败DALL-E 3
撰文: 中关村在线
出版:更新:
今天凌晨,中国一款备受欢迎的大型语言模型“DeepSeek”发布了其最新产品“Janus-Pro”。该模型主要面向图像生成领域,成为业界关注的焦点。
在最新的GenEval和DPG-Bench基准测试中,由70亿参数构成的“Janus-Pro-7B”大放异彩,成功击败了OpenAI旗下的DALL-E 3以及其他热门模型如Stable Diffusion、Emu3-Gen等。值得一提的是,“Janus-Pro”采用MIT开源协议,这意味着其将在商业场景中得到广泛应用。
+6
据了解,“Janus-Pro”是“JanusFlow”大模型的高级版本,并于2024年11月13日正式发布。相较于之前的模型版本,“Janus-Pro”经过优化训练策略并扩大了训练数据范围,同时模型参数数量也有所提升。
延伸阅读:微软提供免费AI图片产生器 GPT-4随便用 更能生成16:9长方形图(点击连结看全文)
+2
这一系列改动为“Janus-Pro”的发展注入了强大动力,在多模态理解和文本到图像指令跟踪功能方面取得了显著进步,并且增强了文本到图像生成的稳定性。尽管该模型目前只能处理384x384分辨率的图像,但考虑到其结构相当紧凑而能达到如此高水平,实属难得。
除了文生图的功能外,“Janus-Pro”还具备图片描述、地标景点识别、文字识别以及图片知识介绍等多种功能。总体而言,这款多模态大模型引起了广泛的关注,并展示了其在行业内所具备的实力与潜力。
延伸阅读:生成式AI应用100强 ChatGPT霸榜挑战者出现 消费者最爱是这些(点击连结看全文)
+14
Perplexity、Claude、ChatGPT实测 3款生成式AI谁可提升工作效率大英百科全书正式跨入AI市场 活化石有新把戏 IPO预估10亿美元WhatsApp正研发AI智能对话服务 聊天或似ChatGPT更可自订角色Elon Musk推出Grok AI聊天机器人 功能强大使用简便但有这些限制ChatGPT全球大死机 用户哀号连Siri也受影响 OpenAI:努力修复AI浣熊IG上狂吸14万粉 文案简单有共鸣外 背后故事竟是如此暖心
【本文获“中关村在线”授权转载。】