近日,人工智能领域的大模型创新者智谱公司宣布了一项重要进展,正式推出了其2025年开源计划的首个里程碑产品——CogView4,这是一款开创性的开源文生图模型,尤为引人注目的是,它首次实现了对汉字生成的支持。
CogView4在业界权威的DPG-Bench基准测试中脱颖而出,综合评分位居榜首,标志着在开源文生图模型领域达到了新的技术高峰(SOTA)。尤为该模型遵循Apache 2.0协议,这在图像生成模型中是前所未有的。
智谱公司在GitHub平台上分享了CogView-4模型的diffusers版本,这一版本配备了高达60亿的参数,不仅支持中文输入,还能直接将中文文本转化为图像,极大地拓宽了文生图技术的应用场景。
智谱公司还提供了详尽的技术文档和示例代码,以帮助开发者更好地理解和利用CogView4模型。这一举措无疑将加速文生图技术在中文环境下的普及和应用。
对于对人工智能和文生图技术感兴趣的开发者而言,CogView4无疑是一个不可多得的资源。感兴趣的朋友可以通过以下开源地址获取更多信息: