HCLai

AIGC · Architecture · Human-in-the-loop

Semi-agentic Architectural Image Iteration Workflow

Nanobanana 半自动建筑工作流

2026

01|项目概述 Project Summary

一个围绕建筑 AI 效果图多轮生成场景搭建的半自动工作流原型,用于串联白模输入、prompt 装配、图像生成、feedback 承接与 round/state 状态管理。

它不是一个成熟生产工具,而是一次针对"建筑 AI 生图多轮修改流程"的 workflow prototype:验证哪些环节可以被自动串联,哪些判断仍然需要人工保留。

This project is a semi-agentic architectural image iteration workflow prototype. It connects white-model input, prompt assembly, image generation, structured feedback handling, and round-based state management, aiming to reduce repetitive manual operations in multi-round AI rendering workflows.

02|为什么做这个 Why I Built This

在建筑 AI 生图过程中,每一轮都需要重复组织白模图、参考图、项目背景、修改意见和 prompt。多轮修改时,上一轮图像、feedback、输出结果和文件路径也容易分散在聊天记录、文件夹和命令行之间。

我希望验证:如果把"输入 → prompt 装配 → 出图 → 反馈 → 下一轮"这段流程结构化,是否能减少重复操作,并让每一轮修改更可追踪。

03|工作流怎么设计 Workflow Design

白模主图输入
↓
Stage 1|白模锁几何
锁定体量 / 建筑数量 / 主机位
↓
Stage 2|反馈推进
基于上一轮图像 + feedback case 继续生成
↓
Round / State 管理
记录 project_id / round / prompt / feedback / output / history
Streamlit 工作台界面
Streamlit 工作台界面

04|我做了什么 My Contributions

需求拆解与边界定义

Requirement Decomposition & Scope Definition

两阶段生成策略设计

Two-stage Generation Strategy

结构化 feedback 设计

Structured Feedback Design

本地工作台 MVP 搭建

Local Workflow UI MVP

方法论验证与边界记录

Validation & Boundary Reflection

05|工作台 MVP 展示 MVP Demo

本地工作台 MVP

我将原本需要通过命令行执行的流程,制作成了一个本地网页工作台。用户可以上传白模图或参考图,选择 stage1 / stage2 路线,运行生成,并在下一轮选择标准 feedback case 或手动输入修改意见。

界面支持当前项目状态、最新输出图、前后轮对比、历史轮次回看与本地路径提示。
界面支持当前项目状态、最新输出图、前后轮对比、历史轮次回看与本地路径提示。

06|方法论验证 Validation: case_04a vs case_04b

这一组测试不是为了证明某个 prompt 一定能生成更好的图,而是为了验证:当同一张图作为起点时,不同强度的 feedback 是否会带来可观察的推进差异。

测试设计

为了验证"环境完成度"反馈是否需要不同强度档位,我将原 case_04 拆分为:

两组测试使用同一个 Round 2 图像作为起点,唯一变量是 feedback 强度。

Round 2 Anchor
Round 2 Anchor
case_04a 保守版结果
case_04a 保守版结果
case_04b 推进版结果
case_04b 推进版结果

测试结论

07|反思与边界 Reflection & Boundary

反思

这个原型并不一定比直接与强图像模型对话更高效。对于高审美、高语境、高模糊度的图像探索,开放式人机对话仍然更灵活。

它的价值不在于替代人工审美判断,而在于验证:当修改意图可以结构化表达时,系统能否自动承接上下文、管理轮次、记录反馈,并提供可追踪的多轮执行机制。

因此,我更愿意把它定义为一个 AI workflow prototype,而不是一个成熟生产工具。

This prototype is not intended to replace open-ended visual dialogue with strong image models. Its value lies in workflow abstraction, state tracking, and controlled feedback validation.