腾讯宣布旗下的混元文生图大模型全面升级并对外开源。
包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。
该模型支持中英文双语输入及理解,参数量 15 亿。升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构,不仅可支持文生图,也可作为视频等多模态视觉生成的基础。
开源地址:https://github.com/tencent/hunyuandit
AI Funko Pop Generator:一个基于人工智能的免费图像生成器
Stable Artisan:一个基于Discord的媒体生成和编辑工具