OpenAI 正式推出了最新的图像生成模型,在文字渲染和复杂版面创作上实现了重大突破。新系统让用户能够生成完整的杂志设计,并配备精准的排版功能。这一发布标志着人工智能在图形设计领域迈出了重要一步。
这项技术不再局限于简单的单张图片生成,而是能够直接产出适合出版的视觉格式。
升级后的模型能精准渲染多语言文字,支持多种复杂格式
这次发布最亮眼的特点就是文字生成能力的大幅提升。以前的模型常常在拼写或文字摆放上出问题,而 ChatGPT Images 2 彻底解决了这些痛点,能在各种复杂视觉格式中准确渲染多语言文字。
用户现在可以快速生成带标注的数据信息图、专业演示幻灯片,还有细节丰富的地理地图。系统还支持创建风格化的漫画页面,对话气泡清晰易读。创作者完全可以跳过外部修图软件,直接靠模型完成文字密集的设计工作。
创作者能在同一个工作空间里搭建结构化版面
通过把这些图形能力直接整合进 ChatGPT,OpenAI 为用户提供了一个统一的创作环境,既能撰写内容,又能精准排版。界面会根据详细指令,把标题、正文和背景图片准确放到指定位置。
模型能理解结构化指令,让文字与生成的插图完美对齐。一整版杂志跨页设计,只需在一次连续对话中就能完成。
新功能开放梯度与 API 定价同步更新
新图像模型的开放采用分层推进策略。OpenAI 首先向付费订阅用户开放,企业客户与 Plus 用户同步获得访问权限。功能集成进了现有订阅计划,并未提高基础费用。
对于通过 API 调用新模型的开发者,结构化定价略有下调。图像生成输入费用为 8 美元,缓存输入 2 美元,输出 30 美元;文字处理标准输入 5 美元,缓存输入 1.25 美元,输出 10 美元。输出端费用比上一代降低了 2 美元。
免费用户暂时只能等待有限预览,OpenAI 正在测试高负载下的系统稳定性,以应对杂志版面生成带来的密集内存需求。
开发者将在本月晚些时候通过更新后的 API 获得访问权限,让第三方应用也能使用强大的文字渲染引擎。免费用户仍在等待有限预览,而公司继续优化系统以处理高强度计算负载。

已注销
全部评论0