不用再画框对线!AutoFigure-Edit 让论文插图活起来

张开发
2026/4/10 13:52:58 15 分钟阅读

分享文章

不用再画框对线!AutoFigure-Edit 让论文插图活起来
本文约3000字建议阅读6分钟本文介绍了西湖大学 AutoFigure-Edit 可编辑论文绘图系统及优势。那些年我们为一张论文插图付出的代价你是否也经历过这样的场景论文截稿在即却在一张系统架构图前耗尽心力。AI生图工具虽然颜值在线但逻辑经常放飞自我而传统的绘图软件又需要专业设计技能学习曲线陡峭。更让人头痛的是——好不容易生成一张满意的图片想要修改一个小图标或者调整几个文字却发现得到的只是一张无从下手的死图。这种生成不可编辑、编辑要重新生成的尴尬局面终于被彻底打破了。从AutoFigure到AutoFigure-EditAI论文绘图可以编辑了论文地址https://arxiv.org/abs/2603.06674西湖大学张岳实验室推出的AutoFigure作为首个能够从长篇科学文本中自动生成出版级学术插图的智能体框架已经入选ICLR 2026。现在团队更进一步发布了AutoFigure-Edit——一个让AI生成图真正活起来的全新系统目前已在github揽获1.6k star。这次升级可不是小打小闹从像素到矢量的跨越生成的不再是静态PNG图片而是完全可编辑的SVG文件。这意味着你可以在浏览器内直接拖拽、改字、换色所有元素都按需定制。参考图引导的风格迁移上传一张你喜欢的风格图AI就能自动学习其配色、字体、图标风格应用到你的科学插图上。再也不用费劲调试Prompt了。内置交互式编辑器生成完成后立即进入可视化编辑画布。调整布局、修改标注、替换图标所见即所得。AutoFigure-Edit的五阶段流程从文本到可编辑SVGAutoFigure-Edit的核心是一个创新的五阶段流水线将文本→可编辑SVG的复杂任务分解为清晰可控的步骤AutoFigure-Edit的五阶段流程风格条件生图 → 分割与结构索引 → 资产提取 → SVG模板生成与精炼 → 资产注入上图由AutoFigure-Edit生成风格条件生图使用文本和参考图生成初始栅格图像分割与结构索引利用SAM3技术识别视觉组件并构建结构骨架资产提取提取透明背景的视觉资产SVG模板生成与精炼生成结构化的SVG布局模板资产注入将视觉资产注入模板形成完全可编辑的SVG核心突破AutoFigure的推理式渲染范式AutoFigure的成功源于其独特的推理式渲染Reasoned Rendering范式将逻辑布局和美学渲染彻底解耦AutoFigure的两阶段解耦设计Stage I生成结构布局Stage II进行美学渲染和文字后处理论文地址https://arxiv.org/abs/2602.03828v1第一阶段概念锚定Conceptual GroundingAI读入你的长篇方法描述平均超过10,000 tokens自动提取核心实体和关系构建初始的逻辑骨架。这一步确保的是正确性——把该有的元素都找出来把该有的关系都理清楚。第二阶段评审-精炼闭环Critique-and-Refine模拟人类设计师与甲方的反复拉锯过程。AI Designer负责根据反馈修改布局AI Critic则专职挑毛病——这里箭头重叠了布局重心不稳文字层级不清晰。经过多轮迭代直到得到满意的绘图质量。第三阶段美学渲染与擦除-修正这是AutoFigure的杀手锏。将优化后的布局渲染为精美图片后系统会用OCR识别图片中的模糊文字把这些文字抠掉用清晰的矢量文字重新覆盖彻底解决了AIGC生图中文字变形、模糊的历史难题。AutoFigure-Edit让矢量编辑成为现实在AutoFigure的基础上AutoFigure-Edit引入了多项技术创新(1) Raw Generation → (2) SAM3 Segmentation → (3) SVG Layout Template → (4) Final Assembled VectorSAM3驱动的自动分割利用Meta最新的SAM3分割技术系统能够智能识别图中的每个视觉组件图标、模块、连接线等并自动生成对应的透明背景资产RGBA。SVG模板自动生成与资产注入系统会根据分割结果自动生成SVG布局模板然后将提取的视觉资产一一注入。最终得到的是一个结构清晰、完全可编辑的矢量文件——每一个模块、每一条连线、每一个文字标注都是独立的对象。参考图风格控制不再依赖模糊的Prompt描述。上传一张风格参考图系统会自动学习其视觉特征配色方案、字体风格、图标类型、间距密度等并应用到生成的科学插图上。这使得实验室风格的统一、期刊风格的适配变得前所未有的简单。开源链接https://github.com/ResearAI/AutoFigure-Edit实验结果用数据说话自动化评估碾压级表现团队在FigureBench基准测试上对AutoFigure-Edit进行了全面评估结果显示其在所有核心维度上都显著领先于现有方法。关键发现使用参考图后Win-Rate从76.0%提升到83.0% 表明参考图引导让生成结果更受用户青睐内容保真度全面提升准确性8.83、完整性8.26、适应性8.37远超其他方法无参考图模式下综合评分达到8.29在视觉设计方面表现优异美学8.32、表达力8.66对比基线方法包括GPT-Image、SVG-Code、Diagram Agent等AutoFigure-Edit在视觉设计、沟通效果、内容保真度三大维度的平均得分和盲测胜率都展现出压倒性优势。用户研究217位真实用户的验证更具说服力的是基于真实使用场景的用户研究。217位参与者通过在线网站生成了262个插图并进行了多维度评价PNG生成质量科学语义正确性4.04/5.048%的用户给满分信息完整性4.11/5.051%的用户给满分视觉呈现质量3.95/5.0风格一致性4.09/5.050%的用户给满分实际可用性126/262位用户48% 认为生成结果可直接用于论文发表无需修改这表明系统已具备真实科研工作流的可用性SVG转换质量转换正确性平均得分3.60/5.036%的用户给满分说明SVG结构保持了高度准确性低评分1-2分在语义维度上非常罕见通常低于12%证明系统能够可靠地保持科学含义和结构完整性。风格迁移与编辑能力从生成到创作的完整体验AutoFigure-Edit的核心创新在于其强大的风格迁移和编辑能力。系统任意用户自定义风格的参考图引导生成只需一键上传参考图片让同一研究内容可以适配不同的视觉风格和出版需求。上图为参考图下图为AutoFigure-Edit的生成结果生成案例CycleResearcherDeepReviewerDeepScientist图片说明以上三组风格迁移案例展示同一论文内容在三种不同参考风格下的生成结果左侧为PNG图右侧为SVG图AutoFigure产生的方法图AutoFigure产生的方法图AutoFigure-Edit产生的方法图应用场景不止是画图AutoFigure-Edit的意义远不止于省时间1. 赋能AI科学家这是AI实现全流程自主研究的关键一步。从文本理解、实验设计到结果分析现在有了AutoFigure-EditAI也能自主生成可视化结果真正打通科研的最后一公里。2. 降低科研创作门槛对于缺乏设计经验的研究者AutoFigure-Edit让高质量科学插图触手可及。无论你是做算法流程图、系统架构图还是复杂的教科书示意图都能一键生成。3. 统一视觉风格通过参考图风格控制整个实验室的论文插图风格可以轻松统一。期刊要求的特定风格如Nature、ICLR风格也能快速适配。开源与可用性西湖大学张岳实验室始终坚持开源理念代码完全开源GitHub仓库包含完整代码库数据集公开FigureBench数据集已在HuggingFace发布在线网站提供一键使用的Web界面交互式编辑器内置可视化编辑画布支持实时调整开源本地部署画布页面网站画布页面如何体验AutoFigure-Edit的论文和代码已全部公开AutoFigure原始论文https://arxiv.org/abs/2602.03828v1AutoFigure-Edit论文新https://arxiv.org/abs/2603.06674HuggingFace Daily Paperhttps://huggingface.co/papers/2603.06674AutoFigure GitHub仓库https://github.com/ResearAI/AutoFigureAutoFigure-Edit GitHub仓库新https://github.com/ResearAI/AutoFigure-Edit在线体验网站https://deepscientist.cc团队简介本项目由西湖大学张岳实验室全面开源。西湖大学自然语言处理实验室成立于2018年9月由张岳教授领导。张岳教授毕业于牛津大学获博士学位现任西湖大学工程学院副院长曾担任EMNLP 2022等多个顶级NLP会议的程序委员会主席。欢迎感兴趣的同学加入有意向申请长期实习、博士生、研究助理者可联系张岳教授邮箱zhangyuewestlake.edu.cn写在最后学术插图不应是科研路上的拦路虎。AutoFigure和AutoFigure-Edit的出现正在重新定义科学可视化的边界——让AI不仅读懂你的研究更能画出你的洞见。下次DDL前不妨试试让AutoFigure-Edit帮你搞定那些繁琐的插图工作。毕竟你的时间更应该花在思考科学问题上而不是在PPT里画框对线。编辑于腾凯校对龚力关于我们数据派THU作为数据科学类公众号背靠清华大学大数据研究中心分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识努力建设数据人才聚集平台、打造中国大数据最强集团军。新浪微博数据派THU微信视频号数据派THU今日头条数据派THU

更多文章