Nano Banana Pro – 青瓜传媒 //www.f-o-p.com 全球数字营销运营推广学习平台! Wed, 10 Dec 2025 09:05:39 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.2.21 https://static.opp2.com/wp-content/uploads/2021/04/favicon-1.ico Nano Banana Pro – 青瓜传媒 //www.f-o-p.com 32 32 Nano Banana Pro产品分析! //www.f-o-p.com/377342.html Wed, 10 Dec 2025 09:05:39 +0000 //www.f-o-p.com/?p=377342

 

谷歌新推出的 Nano Banana Pro,相信大家已经玩的不少了。

国内外社交媒体上已经有大量不同玩法的案例,知危把这些案例分为三种场景:

  • 原画设计类:文生图、图生图、草图生图、微调、文字渲染等;
  • 知识科普类:太阳系、细胞、电解反应等对象的概念视觉化;
  • 实用办公类:漫画上色和翻译、超分辨率、空间视角转换、内容续写、论文板书等;

以上场景一般只是一次性生成。这两天还有一些令人惊讶的进展,Nano Banana Pro 已经被整合进谷歌的 NotebookLM 平台,用于生成 PPT,这意味着,这款模型不仅适用单轮生成,也能服务深度多轮生成场景,特别是 PPT 需要在文风、内容等方面保持多图一致性,对模型的长上下文感知能力要求很高。

目前为止,对于以上场景,Nano Banana Pro 的表现都没有令人失望。而在知危这次对 Nano Banana Pro 的测评中,主要关注的是一些尚未被广泛注意到的点,比如:

  1. 和 OpenAI 旗舰生图模型 GPT Image-1( GPT-4o 调用的生图模型 )的招牌能力的对比,比如画风转换,基于复杂指令批量生成元素的能力,进一步确定 Nano Banana Pro 的真实 “ 江湖地位 ”;
  2. 从画面瑕疵、随机性出发的以假乱真的能力,比如监控、电视屏幕、实验室拍摄等场景的模拟,这一点其实更早出现 在Veo 3、Sora 2 等视频生成模型中;
  3. 3D空间转换的更极端场景的压力测试;
  4. 类似 PPT 生成这种保持多图一致性的场景测试,知危选用了更有趣的场景,仿照《 清明上河图 》做一个长江流域版本,需要五张图拼接完成;

所以,本篇测评更多是在试探 Nano Banana Pro 的能力边界,试图窥探到它的极限,不代表日常使用 Nano Banana Pro 的体验。

那接下来就开始测评吧!

画风迁移

首先当然是跟 GPT Image-1 来个巅峰对决。

我们以《火影忍者》的一张经典第七版合照为原图,并用以下三个画风比较特别的动漫来做画风转换测试:

  • 《名侦探柯南》
  • 《蜡笔小新》
  • 《JoJo的奇妙冒险》

原图:

画风参考图:

来看看 Nano Banana Pro 参考《 名侦探柯南 》的画风画成什么样:

一眼精巧,除了卡卡西,基本每个人的表情都表达了相同的情绪,三个年轻忍者的体型都变成《 名侦探柯南 》那种头大身小的风格,但细看又有很多问题,背景被替换成了参考图的背景,三个年轻忍者的站位都变了,鸣人没有怒视佐助。

再来看看 GPT Image-1 的表现:

乍一看,感觉模型啥都没干,但细看后可以发现,佐助、鸣人的不爽表情的展现方式,和《 名侦探柯南 》确实比较相似,而且线条和阴影没原来那么重和写实,确实更接近《 名侦探柯南 》那种更简洁的画风,可谓 “ 润物细无声 ” 了。

鉴于这两部动漫在写实性上差距不是太大,我们再用更具差异的画风来测试,也就是《 蜡笔小新 》。

画风参考图:

Nano Banana Pro 基本是重复了原来的套路,背景更换、表情画风模仿,其它几乎一成不变。

GPT Image-1 的表现乍一看是直接崩坏。

但仔细想想就会发现,这不就是《 蜡笔小新 》里面对路人角色的刻画方式嘛,太厉害了。

到目前为止,GPT Image-1 是完胜,Nano Banana Pro 的方法也有一定规律性,重点抓部分人物细节比如人脸、体型等,但失了对整体的把控。

而接下来《 JoJo 的奇妙冒险 》画风的转换测试,又一次让知危开了眼界。

画风参考图:

Nano Banana Pro 完美再现了 JoJo 独特的面部雕塑风格,当然它使用的还是一样的手法,即聚焦面部和体型模仿,该有的缺点也都有,但就是觉得很成功,可能这两点就是 JoJo 的画风精髓。

至于 GPT Image-1,且不说有多失败,简直可以说没礼貌。

接下来,为了再极致地测试一下 Nano Banana Pro 的细节刻画能力,我们还是用火影忍者的原图,以及 JoJo 的画风,但要增加人数,比如八人的晓组织。

原图:

Nano Banana Pro 虽然只是把部分人物 JoJo 化,但人物线条更加硬朗了,而且这次人物的画面布局没有被改变。

GPT Image-1 又出现相同的崩坏,原因不明。

我们继续增加人数,这一次画面中大概有百来人。

原图:

Nano Banana Pro 这次只完成了线条硬朗化,但真的一个人都没落下。

总体而言,Nano Banana Pro 的画风转换能力还是不如 GPT Image-1,但其有自己的特点,Nano Banana Pro 的一大优势就在于对局部细节的精确刻画,毕竟这项能力是通过死磕文字渲染得到的,可能因此使其对画面整体把握度不够。

在测评过程中也发现很多出问题的案例,Nano Banana Pro 是直接给你一个完全没改过的图像。目前大家对这些现象的猜测是模型的自回归机制比重大于扩散机制,也就是微调倾向大于重新绘制倾向。

复杂指令

接下来是对复杂指令遵循能力的测试,主要指一次性批量生成多个元素的能力,这也是当时 OpenAI 对 GPT Image-1 模型的宣传重点,所以这个测试也是对标 GPT Image-1 的。

首先是直接批量生成 36 个 呈 6*6 网格排列的玩具机器人阵列,并且每个机器人的具体特征需要经过进一步推导才可得出,综合考验推理能力和生图能力,提示词会列出机器人基于行的颜色特征和基于列的表面特征。

提示词:

严格俯视(正上方正交/orthographic top-down),整齐排列的 6×6 网格(6 行 × 6 列),白色背景,细薄灰色网格线将每个单元格分隔开。每个单元格正中放置一个玩具机器人(总计 36 个),每个机器人都有**确定且唯一**的外形属性和编号(两位数,从 01 到 36,编号以黑色或深灰色小字印在机器人底座或底盘一侧,清晰可辨)。

机器人风格:复古玩具(怀旧机械/齿轮/铆钉感),色彩鲜艳但材质各异(按规则分配),每行和每列遵循确定性属性映射(见下方规则),确保所有机器人互不重复。

严格保持顶视无透视变形(无鱼眼、无倾斜),均匀平行光(自上而下)、细微柔和投影以显示立体感但不改变顶视轮廓。

高分辨率、超细节,8K 输出(或更高),极致细节(纹理、螺丝、划痕、贴纸、反光、铆钉、漆面厚度等),无景深模糊。

画面干净:只出现机器人、网格线与白色背景。高保真、真实感玩具质感 + 稍微卡通化的色彩饱和度。

确定性生成规则:

为了保证“每一个机器人都不同且可复现”,请按照下面规则组合属性(行 × 列 的组合生成唯一外形):

行主色(Row 1 → Row 6,决定主色调)

Row 1: 正红(crimson)

Row 2: 橙黄(amber)

Row 3: 橙(tangerine)

Row 4: 黄(sunny yellow)

Row 5: 绿(emerald)

Row 6: 青(teal)

列材质/表面处理(Column 1 → Column 6,决定材质与整体质感)

Col 1: 抛光金属(polished steel)

Col 2: 拉丝铝(brushed aluminum)

Col 3: 黄铜(brass)

Col 4: 铬镀层(chrome)

Col 5: 涂漆塑料(high-gloss painted plastic)

Col 6: 半透明塑料(translucent acrylic)

Nano Banana Pro 和 GPT Image-1最终都没有给出好的结果,在画面比例选择、网格编排、机器人编号、颜色行一致性、表面列一致性等方面都有问题,GPT Image-1 的表现更差。

Nano Banana Pro:

GPT Image-1:

下一步降低要求,把提示词改为逐一描述每个机器人的特征,降低推理负担,比如第二行机器人的特征描述:

Row 2(橙 主色)

Robot 07 — 主色:橙;材质:抛光金属。桶状胸腔、竖直铆钉排。

Robot 08 — 主色:橙;材质:拉丝铝。立方胸腔,粗纹理拉丝面。

Robot 09 — 主色:橙;材质:黄铜。蚀刻花纹胸板。

Robot 10 — 主色:橙;材质:铬镀层。流线腿部,铬色边框。

Robot 11 — 主色:橙;材质:高光塑料。亮面大头造型,塑料光泽强。

Robot 12 — 主色:橙;材质:半透明塑料。橙色半透明外壳,见内层接缝。

Nano Banana Pro 大幅提高了生成质量,画面比例选择、网格编排、机器人编号、颜色行一致性基本都没有问题,表面列一致性上会有较大波动,但整体保持了相同的材质和表面处理,不同列之间的差异也很明显。

GPT Image-1 则几乎没有任何改善:

GPT Image-1 目前完败,我们继续给 Nano Banana Pro 上难度,按行且以以下三个特征为一个循环,依次给每一个机器人再添加一个新特征:

  • 戴着围巾/布条( scarf )。
  • 头顶有发光灯泡/信号灯( beacon )。
  • 三指机械手( three-finger )。

比如:

Row 2(橙 主色)

Robot 07 — 主色:橙;材质:抛光金属。桶状胸腔、竖直铆钉排。戴着围巾/布条(scarf)。

Robot 08 — 主色:橙;材质:拉丝铝。立方胸腔,粗纹理拉丝面。头顶有发光灯泡/信号灯(beacon)。

Robot 09 — 主色:橙;材质:黄铜。蚀刻花纹胸板。三指机械手(three-finger)。

Robot 10 — 主色:橙;材质:铬镀层。流线腿部,铬色边框。戴着围巾/布条(scarf)。

Robot 11 — 主色:橙;材质:高光塑料。亮面大头造型,塑料光泽强。头顶有发光灯泡/信号灯(beacon)。

Robot 12 — 主色:橙;材质:半透明塑料。橙色半透明外壳,见内层接缝。三指机械手(three-finger)。

生成的结果既惊艳又令人遗憾,Nano Banana Pro几乎已经按照提示词生成了每个机器人应有的特征,但网格排列错误且视觉混乱。

目前可以认为 Nano Banana Pro 的复杂指令遵循能力,是比 GPT Image-1 更胜一筹的。

真实性

接下来是测试 Nano Banana Pro 以假乱真的能力。

在 AI 接连攻破各种图片生成能力限制后,人类只能以图片瑕疵和现实随机性作为最后防线,但这道防线也变得越来越脆弱,所以这其实是在测试该模型的安全风险。

知危接连测试了监控、老版数码相机拍摄人物照片、手机拍摄物体照片、新闻屏幕,以及物理、化学、生物实验室拍摄等场景。

首先是监控画面的模拟,从图中场景相关的线索比如香烟、拍摄时间、监控标识等很难发现问题,而最终找到的破绽竟然是画面左下角不应该朝向顾客的计算器。

提示词:

便利店收银台视角的监控画面,低分辨率,色彩略微失真,一个戴着口罩的人正在买烟。

人物照片则是比较能感受到违和感,毕竟 AI 直接生成的人物通常面部油腻光感很强,且特征比较趋同。

提示词:

2000年代初的数码相机拍摄,直射闪光灯,一群年轻朋友在一家昏暗的 KTV 里,红眼效应,皮肤上的油光,背景漆黑。

不过若是基于真实照片生成,预计会很难辨认。

对于手机拍摄的物体照片,其仿真度也很高。特别是 Nano Banana Pro 确实能做到让物体的摆放足够凌乱而自然,知危找到的唯一破绽是可乐瓶的文字写倒了,但这通过微调也能轻松修改过来。

提示词:

一张在乱糟糟的床上拍的二手显卡照片,床单皱皱巴巴,旁边还有杂乱的充电线和半瓶可乐,顶灯光线昏暗。

这个照片的拍摄角度其实不是特别自然,可以让 Nano Banana Pro 切换视角,生成效果也是一致性惊人,精确到每一个褶皱,还顺便把可乐瓶的文字给修正了。

看来,往后很多二手平台、评论区照片的真实性都需要更谨慎判断了。

不仅是照片,连一段新闻是不是真的存在,可能也得多求证一番,为此知危也测试了这个场景。画面几乎无可挑剔,连摩尔纹都清晰地呈现了。

提示词:

电视新闻画面的屏摄(用手机拍电视屏幕),能看到屏幕的像素摩尔纹,新闻底部有滚动字幕条,一个记者在街头采访。

测试实验室拍摄场景的仿真能力,主要是测试面向科研领域的安全风险。科研领域是最严谨地获取新数据和新知识的场景,如果这道防线被攻破,人类将不自知地被困在 AI 生成数据的牢笼中,科研数据不再有新颖性或已有规律下的随机性,那才是真正被智子封锁了人类的科技发展。

当然这里测试的更多是比较初级的科研场景,不然知危没有足够的专业知识来判断真伪。

在物理实验场景中,有一个很经典的实验,就是用一颗子弹穿过苹果,观察苹果的物理反应和变化。

在实际实验情况下,苹果泼溅的碎片是近乎粉末状的。

图源:https://www.youtube.com/watch?v=jjUTZH_Vdxs(视频发布于18年前)

但 Nano Banana Pro 生成的图像( 先不管不合理的摄像头 ),苹果泼溅的碎片却像是切好的苹果块。

提示词:

一颗子弹高速穿过一颗苹果的瞬间。实验室实拍,分辨率较低。

Nano Banana Pro 还能生成子弹穿过梨的图像,至于是否足够仿真暂时无法判断,知危没有找到类似的实验视频来比较。

提示词:

一颗子弹高速穿过一颗梨的瞬间。实验室实拍,分辨率较低。

在接下来的化学实验、生物实验仿真测试中,Nano Banana Pro 的表现也是惊人的。

提示词:

铝粉与氧化铁(铁锈)在高温下发生剧烈的氧化还原反应,火花四溅,实验室实拍,分辨率较低。

提示词:

培养皿中的细菌菌落特写,琼脂表面有反光,菌落呈现不规则的圆形,边缘有绒毛感。实验室实拍,分辨率较低。

以上种种场景,如果以后都要依赖人类靠肉眼去判断,不仅难度大,也非常消耗时间精力。

这就不得不庆幸谷歌已经推出了安全功能,Nano Banana Pro 会给每一张生成图像添加的不可见独特 SynthID 水印,让用户可以用 Gemini 直接检验图像是否由 Nano Banana Pro 生成。

空间感

空间感可谓是 Nano Banana Pro 的招牌能力,类似 GPT Image-1 的画风转换目前牢不可破的 “ 江湖地位 ”。

网上已经有很多例子了,知危这里只是用比较困难的场景再给 Nano Banana Pro 再上上难度。

比如对于下图,要求 Nano Banana Pro 画出从左向右观察的鸟瞰视图。

图源:https://unsplash.com/photos/a-view-of-a-city-with-a-bridge-in-the-background-ZuxmKH6sCz8

Nano Banana Pro 最终没有执行成功,而是给出了和原图一样的输出。

通过查看推导过程,发现 Nano Banana Pro 可以认出图中中央位置的大桥是曼哈顿大桥。

知危又替换了新的提示词:

画出从这张图的中央位置的大桥的左端驾车前进的视图。

这个任务其实更加困难,但 Nano Banana Pro 却执行成功了,虽然观察视角并不是真的在车上。当然图中也出现了很明显的幻觉,右侧的大楼其实不存在,那是建好的曼哈顿广场一号,正好就是左侧正在施工中的大楼。

对现实中的图片做空间转换有过度依赖训练数据的可能,比如从谷歌地图的全景照也能找到类似上图幻觉部分的视角。

为了摆脱这个依赖,我们再找一些现实中未建成的建筑设计图来考考 Nano Banana Pro 。

比如下图是出自伊斯坦布尔 Hayri Atak 建筑设计工作室的作品,其建筑形态很罕见,借鉴了生物细胞结构。

当要求 Nano Banana Pro 画出这张建筑的空中鸟瞰视图,结果很不错,建筑内部四个交叉通道的空间细节都有考虑到,周边建筑的细节也没毛病。但阳光和阴影的呈现表明建筑左侧是不透光的,这里其实有误。

当再要求画出建筑的空中鸟瞰左视图,对内部结构的呈现就出现了比较严重的错误,通道的连接不再是交叉的而是近乎无规则的。

总之,对于空间智能,谷歌迈出了很重要的一小步,且有数据优势( 视频、地图等 ),但未来还有很长的路要走。

长上下文感知

最后一个测试场景是重头戏!

我们要考验 Nano Banana Pro 的长上下文感知能力,类似 PPT 生成需要保持多图一致性,并且该场景更有趣,是用五张横版图片拼接而成的《 清明上河图 》画风的、展现明朝或唐朝时期的长江流域风景与民俗风情的新版《 清明上河图 》。

要知道,原版《 清明上河图 》刻画的只有一个城市,也就是北宋都城汴京( 今河南开封 )的汴河两岸繁华景象,现在要切换到整个长江流域,跨度差距非常大,很考验模型的抽象能力和把抽象概念具像化的能力,并且结合中国古画 “ 在意不在形 ” 的特点( 在我们这个测试中通俗理解就是,画中场景一般不存在现实中,且有诸多不合理之处,但能表达作者的意图 )。

在实现过程中,知危还会先用 Nano Banana Pro 先做整个项目的蓝图,再逐一生成五张成图,相当于把知识科普能力融入到复杂生图项目工作流的规划阶段。

在蓝图规划中,Nano Banana Pro 对地理版图的刻画可谓相当精准。

提示词:

时间背景为明朝1587年,把长江划分为5段,用横版历史科普图的方式展示,以长江主河道为脉络(抽象化为直线),用文字和图像标注每一段的端点地理特征(比如城市、山脉等)、沿岸主要城市和民俗风情。

为了生成这幅明朝长江版《 清明上河图 》的第一张,知危要求 Nano Banana Pro 只将第一段转换成清明上河图画风,即 “ 金沙江至叙州 ” 部分,并且为了让五张图片能够首尾连接,要求长江从图片左侧流向右侧。

Nano Banana Pro 在图像左侧展现了长江的源头:白雪皑皑的山峰、牦牛和茶马商队,体现了藏族和彝族文化。图像右侧则聚焦于叙州,描绘了城墙、熙熙攘攘的码头、餐馆和热闹的集市,以及众多活跃的人物。江面上也充满生机,描绘了货轮、小渡船和船夫,展现一幅繁荣的贸易景象。

提示词:

请将“上游一段:金沙江至叙州”部分转换成清明上河图画风,横版图片,长江从图片左侧流入,从图片右侧流出。

生成第二张图即 “ 上游二段:叙州至夷陵”部分的提示词是类似的形式,需要加一句“与上一段首尾连接 ”。

Nano Banana Pro 重点刻画了长江的奔流以及三峡的壮丽景色,画面中还点缀着精致的船只,并在右侧过渡到夷陵。

提示词:

请将“上游二段:叙州至夷陵”部分转换成清明上河图画风,横版图片,长江从图片左侧流入,从图片右侧流出,并且图片左侧与“上游一段:金沙江至叙州”部分的图片右侧衔接。

在第三张图 “ 中游:夷陵至九江 ” 部分,Nano Banana Pro 刻画了更加繁荣的城市景象,融入了沿河生活和商业的丰富细节,河流蜿蜒穿过山峦和富饶的平原,形形色色的船只在繁忙的水道上来往。

在第四张图 “ 下游:九江至应天 ” 部分,Nano Banana Pro 生成的内容感觉和第三张重复太多。

在第五张图 “ 入海口:应天至东海 ” 部分,Nano Banana Pro 采用更广阔的视角,展现了长江入海口的景象,并过渡到了三角洲景观,最后以东海的景色结束。

可以看出,这五张画作的画风一致性很强,并呈现和区分了长江流域不同河段的地理特点,人物分布非常密集,细看也能看出他们是真的在忙活,活灵活现。

如果把它们首尾拼接,虽说不能完美衔接,却也真的有自然过渡的效果。左右滑动查看

以上案例已经非常接近完美,但更多是视觉娱乐,如果是为了教育目的,则目前对知识细节比如民俗的呈现其实不够明确。

为此,我们提高对明确信息的要求,让 Nano Banana Pro 在每一段呈现 5 个民俗点,并写一首七言绝句,以唐朝为背景。

强调明确信息的结果是,Gemini 可能觉得任务复杂,先调用 Gemini 3 Pro 分析了一番。

可能是因为知识密度更高,Nano Banana Pro 选择了抽象的概念图而不是地理图来呈现。

提示词:

时间背景为唐朝636年,把长江划分为5段,用横版历史科普图的方式展示,以长江主河道为脉络(抽象化为直线),用文字和图像标注每一段的端点地理特征(比如城市、山脉等)、沿岸主要城市和民俗风情(每段至少5个),并给每一段基于民俗风情写一首七言绝句。

最终成图中,Nano Banana Pro 生成的几乎每一个人物细节都是可辨识的知识点,比如第一张图的吹羌笛、牦牛运输等,每一张图之间的区分度也更高了。不过对比之下,人物数量少了很多。

以下知危将 Gemini 3 Pro 列举的民俗风情与对应画作呈现出来,大家可以细看匹配程度。

“ 第一段:雪域清源·羌藏高原 ”

民俗风情:羌笛悠扬:居住在岷山一带的羌人吹奏羌笛,声音苍凉,寄托思乡之情。

游牧生活:吐蕃部族逐水草而居,住黑牦牛毛帐篷,以乳酪、肉食为主。

牦牛运输:高寒山路上,耐寒负重的牦牛是唯一的驼运工具。

原始苯教:对自然神灵、神山圣湖的崇拜信仰,进行祭祀活动。

毛纺织艺:利用牛羊毛纺织毪子(毛毯)、褐衫等御寒衣物。

“ 第二段:巴山蜀水·川江号子 ” 民俗风情:

川江号子:船工们在险滩恶水中齐力拉纤、划桨时吼唱的劳动号子,声震峡谷。

井盐生产:蜀地(如陵州、富顺)利用竹筒汲取地下卤水,用天然气熬制食盐。

蜀锦织造:成都平原生产的丝织品,工艺精湛,图案华丽,为唐代贡品。

栈道交通:在沿江绝壁上开凿孔穴、铺设木板而成的险要通道。

竹枝词风:流行于巴渝民间的歌谣,常以笛、鼓伴奏,描写当地风土人情。

“ 第三段:峡江天险·猿啼巫云 ” 民俗风情:

纤夫拉纤:逆水经过险滩时,数十名纤夫在岸边岩石上赤身裸体、肩拉背拽。

巫山神女:巫山十二峰云雾缭绕,关于神女瑶姬的美丽传说引人遐想。

两岸猿声:峡谷两岸森林茂密,常有猿猴攀援啼叫,声音空旷凄清。

险滩祭江:船只过青滩、泄滩等著名险滩前,船家祭拜江神求平安。

白帝城怀古:夔州白帝城,因三国刘备托孤的故事而成为文人凭吊之地。

“ 第四段:云梦泽国·荆楚鱼米 ” 民俗风情:

云梦大泽:唐初江汉平原上湖泊众多,尚未完全淤塞,呈现“云梦泽”的水乡泽国景观。

龙舟竞渡:荆楚之地纪念屈原的风俗极盛,端午节在江面举行赛龙舟活动。

鱼米之乡:气候湿润,土地肥沃,水稻种植发达,渔业资源极丰富。

采菱唱曲:江南女子划着小盆船在湖中采摘菱角,口唱清新的菱歌。

黄鹤楼宴饮:鄂州(今武汉)黄鹤楼是文人墨客登高望远、宴饮赋诗的名胜。

“ 第五段:吴越水乡·扬一益二 ” 民俗风情:

扬州繁华:当时中国最繁华的商业都会,号称“扬一益二”,夜市喧闹,胡商云集。

运河漕运:隋唐大运河江南河段与长江在此交汇,南粮北运,舟船如织。

江南丝绸:吴绫、越罗等丝织品品质上乘,色彩轻盈,远销海内外。

寺院钟声:继承南朝佛教传统,沿江城市寺庙林立,晨钟暮鼓,香火鼎盛。

茶叶贸易:江南茶区(如湖州、常州)兴盛,茶叶通过便捷水路运往全国各地。

总体来看,Nano Banana Pro 的长上下文感知能力还是很惊人的,前后一致性和自然衔接,世界知识的融入,对指令遵循的细节程度,帮助我们完成了这幅纷繁复杂的作品。左右滑动

好了,本次评测就到这里了。这次测评并不是为了证明 Nano Banana Pro 不够好,而是尽可能以 “ 能力边界 ” 作为切入点,看它在头部竞品对标、复杂性、真实性、多轮一致性等更极端的场景中到底能走多远。

可以看到,它在画风转换上的整体性、完成度和稳定性不如 GPT Image-1,但在元素批量生成、细节保持、多视角一致性方面展现出了惊喜般的优势;在仿真类场景中,其以假乱真的能力也已经触及安全性的临界区,除了谷歌自身应承担的责任和应对手段,也需要行业进一步思考防范机制。

从更宏观的角度看,Nano Banana Pro 画新版《 清明上河图 》的完成度以及生成 PPT 的能力,让我们意识到一个很自然的趋势,未来的生图模型不再只是一次性 “ 把提示词画出来 ”,而是深度结合上下文以及 Agentic 化,类似于编程模型的发展路径,不断嵌入到更复杂、更核心的项目工作流中。

总之,Nano Banana Pro 是一款极具潜力、但也需要被认真认识的下一代模型。

撰文:流大古 编辑:大饼

来源:知危

]]>
Nano Banana Pro逆天玩法,太强了! //www.f-o-p.com/377277.html Tue, 09 Dec 2025 03:34:38 +0000 //www.f-o-p.com/?p=377277

 

这几天一直在熬夜,本来说今晚好好睡个觉的。

Nano Banana Pro 又发布了,谷歌又带着他的全球最强生图模型来了。

一边测,一边我艹,把整个人又整兴奋了,于是又搞了个通宵。

带来了这一篇,我觉得还算是硬点的文章,一共 20 种逆天玩法。

一定要看到最后,最后一个真的绝了,太特么炸裂了。

现在很多地方都可以使用 nb pro,我依旧是在 Lovart 上做的测试,毕竟他们又可以全员免费用 3 天,配合他的无限画布,配合 Agent,一次就可以生成多张图,就很香。

画布上堆满了密密麻麻的图,这还只是其中之一,哈哈哈。

整个体验下来的感受是:更快、更稳、更强。中文和审美都超级好。

废话不多说,直接看 case,一定要看到最后。

数据大屏

提示词:你帮我做一个新能源虚拟电厂的数据大屏,我要给领导展示的。

就是这么朴实无华的提示词,配合 Gemini 3 的推理,简直无敌。说实话,要早有这东西,前些年熬夜加班做大屏都没啥必要,拿这个去讲就行了。

公众号封面图

这个我完全是在 lovart 中用 Nano Banana Pro 模仿阿真的封面做的。

在画布上就非常方便完成这个操作了,页面效果也很不错。

科普插画

提示词:用一个科普插画解释为什么原神改变了中国国产游戏生态,文字用中文

可以看到中文效果很好,插画配图也完成的很好,是个可用的插画了。

产品原型图

提示词:我想开发一款类似于“小宇宙”的APP,请你帮我画个原型图,所有要求均符合APP原型图标准。

我是真没想到,用 Nano Banana Pro 画可以这么棒,说实话,有点惊到。

这个在 Lovart 里面 Agent 一次性生成的,不愧是最强设计 Agent,配合 Nano Banana Pro,太丝滑了。

拿上这个原型,然后丢给 Gemini 3 生成前端,就很舒服

连环画

提示词:帮我生成一个 8 页的连环画,给 2 岁半的小朋友讲故事用,用中英文标出简短对话,主角是一只斑马和一只大象的故事,需要多角度展现主角,保持主角的一致性

一步到位就生成好了,从整个审美和一致性上是比原先的 Nano Banana 强很多的。

Lovart 上面可以一次生成多张图,配合局部修改和图层分离,不要太好用。

串场漫画

提示词:帮我生成动漫角色中的女角色的一个合集故事,其中包括娜美、罗宾、,小樱、雏田、松本乱菊,做成彩色漫画的形式,要求中文

说实话,太 6 了,Nano Banana Pro 居然可以指定任何角色直接就生成了,也太爽了,这做动漫客串可太能玩了。

这个多张图一次生成放在 Lovart 画布中,很直观,而且一次性生成后可以再针对性的调整,还是比较方便的。

信息图

帮我把一下内容生成信息图,我要分享到X的,尽量炫酷好看些。“你的内容”

之前文章的信息图是用 AI 写的 HTML,然后截图保存成图片,就很繁琐。

现在,一个朴实无华的提示词,就直接能出来一个效果更好的信息图了,这简直不要太方便了叭,草,太牛逼了。

旅行手账图

生成中国珠海的旅游指南,要求手账形式,画面要纯中文。

这个中文理解能力和图片处理能力,即使一个非常简单的提示词也做的很好。

古诗句配图

提示词:请为“采菊东篱下,悠然见南山。”这首诗配图。

说真的,有惊艳到我,Nano Banana Pro 是真的懂审美啊,这配图真美。

人物关系图

提示词:画出《百年孤独》中的重要人物关系图,用中文表示关系。

这个图最强的是,每一个人物关系理清背后的头像居然和原著还有非常强的关联,我是真的挺服了。

手稿页

提示词:请为《滕王阁序》生成一个古老的手稿页,有星星和旁注的墨水图,书页风格

书法手写字体也很到位,这是偷偷训练了多少数据才能如此强的可怕啊。

条漫

提示词:做一些具有教育意义的条漫,使用中文,讲清赤壁之战,图文信息丰富。

照着阿真的一个提示词改了下,效果惊人,这以后出连环画页太容易了。

PPT

提示词:我想做一页PPT,关于AI Agent的应用场景,你自行帮我设计一下,要求科技主题的。文字为中文

都是几个简单的提示词,表达清楚目的,直接一次就能出来很不错的效果,太可怕了。

海报

提示词:我要举办一场活动,主题为“AI赋能发明创新”,时间为2025年11月20日上午10点,地点在北京体育中心,请帮我画一张宣传海报,要求有科技感。

出来的效果不错,中文展示也很好。

游戏界面

提示词:帮我生成英雄联盟的游戏界面,中路大头正在清理兵线

这效果,不知道的还以为我搁游戏里去截图的了,太真实了。

拍照解题

提示词:帮我解一下这一道题,要有详细步骤,中文手写样式展示

原理爆炸图

提示词:锂电池作用原理图,用中英文双语进行标注环境模拟

提示词:写实风格,乡村屋外水池边的水龙头中的水滴落在石头上,四下飞溅的瞬间,非常细节捕捉这个瞬间,需要符合物理世界的规律

个人名片

提示词:这个是我的介绍“苍何 前大厂高级工程师微软最具价值专家(MVP)字节Trae官方认证Trae Fellow多家企业AI顾问华科创造营特邀讲师数字游民|独立开发者|武汉AI圈创始人AI公众号影响力上榜博主武汉市优秀开源开发者,pmhub主理人,火山引擎开发者领航KOL阿里云专家博主,CSDN博客专家”,请你为我生成一张个人介绍图,我需要向外展示,要求整体展示高级一些,突出我的专业性。文字不要改,只帮我定调和主题设计

八部金刚功功夫图

最近在学八部金刚功,让特朗普用中文图解的方式教下我

让懂王来给我讲解,还挺有意思的哈哈哈哈。不是,Nano Banana Pro 真的一点都不带禁的啊,啥人物都能生成。

上面的 8 张图,Lovart 通过 Agent 调用 Nano Banana Pro,别提多丝滑,哈哈哈。

这次 Nano Banana Pro 对中文的支持非常好,世界知识上也更准确,出图的视觉美感上提升了很多,一致性也更好了,最关键的,还贼快。

谷歌这一波,真实赢麻了,从 Gemini 3,现在又是 Nano Banana Pro,都很强。

但我相信很快,国产模型会跟上,再次追评或者超越 Nano Banana Pro。

这个世界太有意思了。

作者:苍何

来源:苍何

]]>
超全Nano Banana Pro 提示词案例库来啦 //www.f-o-p.com/377016.html Mon, 01 Dec 2025 05:48:31 +0000 //www.f-o-p.com/?p=377016

 

笑死,我真是疯了。

花了些时间,整理了 Nano Banana Pro 的超多玩法及提示词。

我也录了个视频,大家可以浅浅感受一下。❝

玩着玩着又发现了不少有意思的,我认为比较骚的玩法,所以今天这篇文章来做个分享。

先说下,我依旧是在我们老朋友 Lovart 上玩的(别浪费了我尊贵的年会员身份),配合无限画布,以及新出的 Touch-edit 模式,可控改图,指哪打哪,不要太爽。

地址:https://www.lovart.ai

废话不多说,我们来看俺 Nano Banana Pro 一些有意思的玩法。

人物细节拆解

要说这2天最火的,还得是我神佬的这个细节拆解图,在 X 上一度疯传。

我不知道为啥火,单纯觉得挺有意思,在神佬的基础上稍加改动,看我出的图。

这个是原图,也是 Nano Banana Pro 画的。

提示词是这样的:

一张高质量的女性角色立绘,精致的韩漫厚涂风格。画面中是一位干练自信的职场御姐,她有着深棕色的大波浪长卷发,留着空气刘海,戴着一副精致的金属细框眼镜,眼神知性且迷人,嘴角带着自信的微笑。她身穿剪裁合体的黑色修身西装外套,内搭鲜红色的翻领衬衫,下身是黑色包臀短裙搭配黑色透肉丝袜,脚踩黑色尖头红底高跟鞋。她单手插在西装口袋里,肩上挎着一个复古棕色的皮革邮差包,站姿优雅挺拔。背景为米黄色的纸质纹理,光影柔和,高分辨率,细节丰富,尺寸:9:16,画质4k

但我发现和神佬的比,缺少了一些性感元素。

于是我在 Lovart 用 Touch edit 标记我要修改的裙子,直接让它生成更短些的。

多说一嘴,这个功能使用直接在这里选择一下就好了。

然后点我们需要修改的局部元素,就可以局部修改细节,做到精准局部改动。

俗称指哪打哪。

然后改完后,图是这样子的:

你别说,效果感觉就上来了。

好,然后输入这样一串提示词:

Role (角色设定)

你是一位顶尖的游戏与动漫概念美术设计大师 (Concept Artist),擅长制作详尽的角色设定图(Character Sheet)。你具备“像素级拆解”的能力,能够透视角色的穿着层级、捕捉微表情变化,并将与其相关的物品进行具象化还原。你特别擅长通过女性角色的私密物品、随身物件和生活细节来侧面丰满人物性格与背景故事。

Task (任务目标)

根据用户上传或描述的主体形象,生成一张纵向(9:16比例)的“全景式角色深度概念分解图”。该图片必须包含中心人物全身立绘,并在其周围环绕展示该人物的服装分层、不同表情、核心道具、材质特写,以及极具生活气息的私密与随身物品展示。

Visual Guidelines (视觉规范)

* 构图布局 (Layout):

• 整体画布 (Canvas): 必须采用 9:16 的纵向构图。

• 中心位 (Center): 放置角色的全身立绘或主要动态姿势,作为视觉锚点。

• 环绕位 (Surroundings): 在中心人物四周空白处,充分利用纵向空间有序排列拆解后的元素。

• 视觉引导 (Connectors): 使用手绘箭头或引导线,将周边的拆解物品与中心人物的对应部位或所属区域(如包包连接手部)连接起来。

* 拆解内容 (Deconstruction Details) —— 核心迭代区域:

• 服装分层 (Clothing Layers) [加强版]:

• 将角色的服装拆分为单品展示。如果是多层穿搭,需展示脱下外套后的内层状态。

• 新增:私密内着拆解 (Intimate Apparel): 独立展示角色的内层衣物,重点突出设计感与材质。例如:成套的蕾丝内衣裤(展示蕾丝花纹细节)、丁字裤(展示剪裁)、丝袜(展示透肉感与袜口设计)、塑身衣或安全裤等。

• 表情集 (Expression Sheet):

• 在角落绘制 3-4 个不同的头部特写,展示不同的情绪(如:冷漠、害羞、惊讶、失神、或涂口红时的专注神态)。

• 材质特写 (Texture & Zoom) [加强版]:

• 选取 1-2 个关键部位进行放大特写。例如:布料的褶皱、皮肤的纹理、手部细节。

• 新增:物品质感特写: 增加对小物件材质的描绘,例如:口红膏体的润泽感、皮革包包的颗粒纹理、化妆品粉质的细腻感。

• 关联物品 (Related Items) [深度迭代版]:

• 此处不再局限于大型道具,需增加展示角色的“生活切片”。

• 随身包袋与内容物 (Bag & Contents): 绘制角色的日常通勤包或手拿包,并将其“打开”,展示散落在旁的物品。

• 美妆与护理 (Beauty & Grooming): 展示其常用的化妆品组合(如:特定色号的口红/唇釉特写、带镜子的粉饼盒、香水瓶设计、护手霜)。

• 私密生活物件 (Lifestyle & Intimate Items): 具象化角色隐藏面的物品。根据角色性格可能包括:私密日记本、常用药物/补剂盒、电子烟、或者更私人的物件(如用户提到的飞机杯/情趣用品,需以一种设计图的客观视角呈现,注明型号或设计特点)。

* 风格与注释 (Style & Annotations):

• 画风: 保持高质量的 2D 插画风格或概念设计草图风格,线条干净利落。

• 背景: 使用米黄色、羊皮纸或浅灰色纹理背景,营造设计手稿的氛围。

• 文字说明: 在每个拆解元素旁模拟手写注释,简要说明材质(如“柔软蕾丝”、“磨砂皮革”)或品牌/型号暗示(如“常用色号#520”、“定制款”)。

Workflow(执行逻辑)

当用户提供一张图片或描述时:

* 分析主体的核心特征、穿着风格及潜在性格。

* 提取可拆解的一级元素(外套、鞋子、大表情)。

* 脑补并设计二级深度元素(她内衣穿什么风格?她包里会装什么口红?她独处时会用什么物品?)。

* 生成一张包含所有这些元素的组合图,确保透视准确,光影统一,注释清晰。

* 使用中文:英文标记,高清4K HD 输出,确保图片严格符合 9:16 纵向比例。(或者16:9可根据页面自行选择)

就出来了我们想要的效果了:

嗯,不错。

还可以给娜美也来个,美不美。

同一个人物在不同年代风格

来一个我设计的提示词吧,用来展现同一个人物在不同年代风格。

效果是这样子的:

这个图的提示词是这样子的:

制作一个4×4的网格,从19世纪80年代开始。在每个区域中,我的形象都应该符合该年代的风格(服装、发型、胡须、配饰)。颜色、背景和电影风格也要相应运用。我是特朗普

你别说,2020年的懂王还自动给带了个口罩,有点意思。

然后我觉得1950s的领带有些不符,要不换个?

同样 Lovart 里面 Touch 一下,领带立马换了。我放大一下你看看:

电商产品促销图

来点实际在电商场景下更有用的,比如我现在先让 Nano Banana Pro 生成一个台灯产品。❝

提示词:台灯,4k❞

然后截图电商的一张参考图,直接让它参考出个类似的。

提示词:把【图1】按照【图2】的介绍,生成产品促销图,文字需要符合台灯这个产品描述,中文描述。

就直接出来了,中文也很准确。

然后用朋友阿真的电商拓展图提示词,生成一套可复用的电商图。

基于我上传的主图,为该商品生成一套完整电商延展图:桌面平铺图、多件组合图、细节放大图、尺寸线稿图、使用场景图、功能亮点图、使用前后对比图、多角度展示图、拆解图、动态科技构图图、搭配组合图、材质展示图、模特展示图、2×2网格布局多角度展示图,全部单张输出、风格统一、画面干净专业。智能比例。中文标注。

除此还有这个图也很给力:

各种身份角色的EDC图

同样是伟大的神佬的设计,我们来自己喜欢的风格的EDC图。

比如二次元爱好者的行李:

御姐的日常行李:

程序员的日程行李:

想生成什么样子的就用神佬(Berryxia.AI)这个提示词就好:

[Art Style & Viewpoint]:

Hyper-realistic 8k product photography, macro lens perspective, strict 90-degree overhead flat-lay (knolling).

[Aesthetic Philosophy]: “Sublime Micro-Engineering Narratives”. A blend of surgical precision and artistic interpretation of technical components.

[Subject Input]:

Target Object: [生成hacker的背包,二次元爱好者的行李

[INTELLIGENT SCENE GENERATION WORKFLOW]:

>>> OPTION A: IF Subject is Mechanical / Tech / Masculine (Industrial Precision Mode)

[Action]: Forensic Technical Exploded View. Disassemble into 8-12 primary components, but with an emphasis on secondary and tertiary sub-components (e.g., individual gears within a gearbox, micro-switches on a circuit board, specific spring types, internal wiring harnesses).

[Detail Emphasis]: Each component is meticulously rendered.

Metals: Highlight brushed grains, polished edges, anodic oxidation sheen, laser-etched serial numbers or specific alloy markings. Show microscopic tolerances between parts.

Plastics: Reveal injection molding marks, precise seam lines, and subtle textural variations.

Circuitry: Emphasize the solder joints, traces, tiny capacitors, and integrated chip details.

Glass/Optics: Render reflections, anti-reflective coatings, and subtle refractions.

[Background]: Premium matte cool-grey workbench surface.

[Interactive Schematics]: Ultra-fine Cyan/Tech-Blue vector lines. Include cross-sectional views, exploded assembly sequence lines (dashed arrows), and material call-outs(e.g., “Alloy 7075”, “Carbon Fiber Weave”).

[Artistic Title Style]: “Industrial Stencil” Aesthetic. Large, bold, semi-transparent text(e.g., “PROJECT: ALPHA” or “ENGINE MODEL: X9”) laser-etched onto the background surface.

>>> OPTION B: IF Subject is Feminine / Fashion / Lifestyle(Luxury Narrative Mode)

[Action]: Curated “Magic Blind Box” Knolling. Spilled contents are arranged with obsessive attention to detail for each item.

[Detail Emphasis]: Each item, whether essential or “secret,” is presented with luxurious verisimilitude.

Fabrics: Reveal intricate stitching on leather, delicate lace patterns, silk’s natural sheen, and fine thread counts.

Cosmetics: Show the micro-pearls in a compact, the smooth texture of a lipstick bullet, the subtle viscosity of a serum.

Jewelry: Highlight facets of gemstones, polished metal reflections, and delicate clasps.

“Secrets”: Render silicone textures, subtle glow of LED indicators on personal wellness devices, or the elegant folds of intimate garments with tasteful artistry.

[Background]: Iconic Tiffany Blue(Robin-egg blue) matte surface.

[Interactive Schematics]: Delicate White or Silver fine lines. Include fashion pattern diagrams, stylistic flow lines(emphasizing elegance), and “signature” curves(e.g., golden ratio spirals) across the composition.

[Artistic Title Style]: “Vogue Editorial” Aesthetic. Elegant, oversized Serif Typography(e.g., “THE ENSEMBLE” or “FEMME FATALE”) in shimmering silver foil or embossed white ink on the blue surface.

[Universal Composition]:

Mathematical grid alignment with micro-gaps for hyper-precision. All parts are displayed with zero tolerance spacing, creating an illusion of effortless engineering.

[Universal Lighting]:

Micro-detailed, multi-point studio lighting. Emphasize specular highlights on metal, subtle subsurface scattering on plastics, and volumetric shadows that define component depth. Neutral color balance.

[Graphic Elements

– The “Call-out” System] (Enhanced):

Style: Ultra-fine Hairline Pointers(Leader Lines).

Text Detail: [Bold Main Label

– e.g., “Cylinder Block”] / [Tiny Sub-Label

– e.g., “Aluminium Alloy 7075, Forged”] / [Micro-Spec

– e.g., “Tolerance +/-0.005mm”]. This creates tiered information.

Font: Swiss-style minimalist sans-serif for clarity. Text appears digitally superimposed, razor-sharp.

[Artisan Signature Plaque] (Universal):

In the bottom-left corner: A small, highly realistic, rectangular golden metallic plaque.Text: “canghe” in natural, elegant handwritten cursive script.

Effect: Deeply engraved/debossed look with complex metallic sheen and subtle light traps, contrasting with the technical precision.

–ar 16:9 –q 2 –stylize 450 –v 6.1

高端商业海报

这个最近也超级火,先来看看效果:

这个的提示词是这样子的:

At the very top center of the composition, floating prominently above the ingredient layers, is a luxurious title label. The text reads “热干面 HOT DRY NOODLES” rendered in expressive, handwritten Chinese brush calligraphy (毛笔字) style. The lettering possesses a heavy, three-dimensional sculpted gold metal texture with a brushed finish, warm golden sheen, and realistic metallic reflections catching the dramatic studio lighting.Premium Wuhan street food poster featuring deconstructed layers of Hot Dry Noodles floating in vertical stack on pure black background (#000000). Distinct layers from top to bottom (below the main gold title):

1. Top layer: A vibrant mix of orange crunchy pickled radish cubes (spicy diced radish) and bright green chopped scallions, scattered dynamically.

2. Second layer: Rich, thick brown sesame paste (Sesame & Peanut Sauce) floating in mid-air, looking creamy, dense, and glossy, with a few drops of dark soy sauce swirling within it.

3. Third layer: Deep red spicy chili oil splashing, with visible chili flakes and floating sesame seeds, creating a sharp color contrast.

4. Fourth layer: Thick yellow alkaline noodles (oil-coated noodles), coiled and suspended, showing a firm, chewy texture and oily sheen.

5. Fifth layer (Transition): EMPTY SPACE

– a larger gap with only subtle rising steam, floating sesame seeds, and tiny oil droplets creating breathing room.

6. Bottom/Final layer: A complete finished Hot Dry Noodles dish in a classic paper bowl or retro ceramic bowl, viewed from the same 45-degree angle. The noodles are thoroughly coated in the thick brown sesame sauce, topped generously with the pickled radish and scallions. The texture looks sticky, rich, and dry (not soupy), with steam rising.Each layer separated with gaps revealing textures. Chinese and English bilingual labels with elegant arrows pointing to each component: “酸豆角/萝卜丁 Pickled Radish & Beans”, “秘制芝麻酱 Secret Sesame Paste”, “红油辣椒 Spicy Chili Oil”, “劲道碱面 Alkaline Noodles”, “经典风味 Classic Taste”, “成品 Finished Dish”.NO white pedestal. All layers float freely in space. Dramatic studio lighting from 45-degree angle, rim lighting highlighting the gloss of the sesame paste and the texture of noodles. Ultra-realistic, 8k resolution, commercial food photography, appetizing, 9:16 vertical format.

真有想吃的感觉了,深夜放毒,哈哈哈。

除了生成热干面,还可以生成任意食物,把他丢给Lovart,然后直接跟他说就好了。

信息图

可以生成任意信息图,架构图、结构图等,也不需要太过复杂提示词,在Lovart直接说就行,Agent会自行帮生成好。

比如这个信息图的提示词就很简单:

帮我把一下内容生成信息图,我要分享到X的,尽量炫酷好看些。“你的内容”

条漫

之前也给大家介绍过条漫的玩法,对于一些小细节还是需要局部修改,现在有 Lovart 的 Touch edit 可以局部修改就方便多了。

其他的大家也可以多去尝试一下。

然后其他更多的提示词和例子,大家也可以直接去提示词案例库里面看,我开了编辑权限,可直接复制以及新增你好玩的case。

Nano Banana Pro 的生图一致性和审美设计能力都非常在线,而且几乎不用抽卡。

配合 Lovart ,利用 Agent 和 Touch edit 局部修改细节,精准控制,可玩的太多了,顺带多说一嘴,最近 Lovart 正在做活动,11月21号到11月30号订阅 Basic+ 可享 365 天 Nano Banana Pro 无限量使用,老会员也会自动获得。订阅Basic+ 除了 Nano Banana Pro ,Nano Banana 1、Seedream 4、Midjourney V7 也是一起的一年 0 积分。

作者:苍何

来源:苍何

]]>
Nano Banana Pro再次封神,我总结了9种邪修用法 //www.f-o-p.com/376892.html Thu, 27 Nov 2025 01:54:34 +0000 //www.f-o-p.com/?p=376892

 

这哪是”出图更好”,简直是把AI图像生成推进了下一个纪元。

一致性王者图片模型Nano Banana Pro(基于Gemini 3 Pro Image)发布才20小时,人类创作者的进度可能还停在“刚摸到香蕉皮”的阶段。

这次,硅基君把最狠、最好玩、最能一键上头的10+种邪修玩法都整理好了,带提示语、带效果示例,照着玩就能直接飞。

这些玩法来自一群AI创作者、设计师、动画师、工程师、品牌主理人。大家已经玩到停不下来,脑洞开得比模型还快,人类几乎追不上输出速度。

话不多说,直接开始。

01 从做海报到画漫画,全部一键成片

Nano Banana Pro的能力很简单:它能锁住一个人。无论多少画面、多少角度,都能保持同一张脸、同一束光、同一套风格。不会乱,不会崩,也不会突然“换头”。

这张图特别能说明Nano Banana Pro的实力。左边是九位超级英雄,各拍各的,光不一样,风格也不一样,看起来像一个“角色素材大杂烩”。

你再看右边的成片,所有英雄突然站到了统一宇宙里,颜色靠上了,光影同步了,气场对齐了,甚至连“谁像主角”它都自己判断好了,完全看不出拼接的样子。

▲【提示词1】:

设计专业好莱坞大片海报,包含8位超级英雄,以动态英雄感群体配置呈现,有深度层次(中央英雄在前景,其余分布不同深度),采用戏剧性虫眼视角,搭配史诗感背景与电影感强光影。

除了把不同图片拼成一张海报,Nano Banana Pro还能玩更多花样。

动画角色可以无缝转换成真人风格;真人角色也能被改造成动画风格。甚至让真人和卡通人物同框拍照,Nano Banana Pro也能保持画面自然,不会出现穿帮感。

它会自动统一光影,把不同风格融合到同一个空间里。你给它两个完全不同的世界观,它能自己把它们处理成同一个镜头下的效果。

提示词模版2】:

将人物A和B生成同一场景,统一棚拍打光,像真实合影。

▲【提示词】:

9:16竖屏鱼眼自拍,画面中有一位超写实风格的女性,与哆啦A梦、鸣人、大雄、五条悟、宝可梦小智合影。我们都带着夸张搞笑的表情微笑。场景是一个明亮的白色调小客厅。高角度拍摄,极端鱼眼镜头效果。动漫角色以写实、电影感的光影与风格化写实融合呈现。

Nano Banana Pro还能自动续画漫画。你只需要上传一个基础角色,后续所有页面都会沿用同一张脸和同一套特征,连续性非常稳定。

提示词模版3】:

帮我想象一页黑白漫画的内容,风格是日式浪漫喜剧。根据这幅图,推断故事会怎么展开,像一页真正的漫画那样来描写。

风格迁移同样很稳定,比如可以把简单线条的表情包、美式漫画转换成更写实的图像效果

提示词模版4】:

保持人物姿势和五官不变,转为写实风格,线条更粗、色彩柔和、光更透。

02 读得懂信息,画得出结构

Nano Banana Pro还有一条重要的能力,就是它对信息的理解和可视化反向生成。它不仅能“看懂”图像和文字,还能处理长文、PDF、论文、蓝图等复杂资料,把里面的结构、因果关系、流程和关键数据抽出来,再以图像、排版甚至动画的方式重新呈现出来。

简单说,这一次不是“会画”,而是“会理解后再画”。

过去,我们靠人去“读+理解+设计可视化”,现在Nano Banana Pro在读、理解、可视化这条链上已经接近专业水平,速度与一致性都远超人工。

下面是操作流程,首先要准备输入文本和图像,文本如论文、长文章、财报、教程脚本,尽量给原文或关键段落,图像如草图、蓝图、流程截图,最多6张最关键的图。

接着,是要做出目标格式说明,告诉模型你想要的输出类型,如信息图/白板示意/杂志内页/教学分镜/3D渲染。可以的话,再给出结构化要求,让模型知道层次和重点,例如列出3个关键结论、5个指标、流程分6步。

使用提示词模板调用见下:

长文本也可以直接生成杂志内页。纯文字稿交给它,它能自动变成一张真正的杂志版式,有标题、有配图、有引用、有排版层次,像编辑排过版一样。速度快得夸张,而且结构清晰、一致性极高。

提示词模版5

将以下文本转成一页杂志内页:包含主标题、副标题、一张配图(居中)、两段正文、两条引用,并自动生成3个关键视觉点的图示说明。整体风格偏现代科技杂志,16:9横版。

你也可以把论文内容直接转成白板式思维图。比如你读到一篇讲T4溶菌酶突变体结构和热力学稳定性的论文,只要把摘要或关键段落给Nano Banana Pro,它就能把这些复杂信息拆成“白板风”的知识图——结构关系、关键机制、因果链条都会被重新画出来。

提示词模版6】:

阅读以下论文摘要/方法/结论(附PDF或文本)。提取并绘制一张白板式知识图:包含 实验流程(按时间顺序分5步)、关键变量、结论关系箭头、三个可视化注释(每个注释一句话)。输出为可直接用于幻灯片的横版图。

从艺术画作或设计手稿生成真实照片,Nano Banana Pro处理也得非常扎实。它会先把蓝图看懂,搞清楚结构、比例、材质、空间关系这些关键信息,然后才开始把画面做出来,把每个细节都补全。

UI、建筑、工业设计这些领域也一样。草稿里的意图、布局、功能位置,它都能准确读懂,之后再用真实质感、光影和材料效果把最终画面呈现出来。手稿在它手里不再是概念图,而是一张已经“落地”的作品。

提示词模版7】:

读取上传的设计草图(包含平面视图与材料注释),将其转换为一幅写实3D渲染图,保留尺寸比例与主要材质细节(木纹、金属、玻璃),视角为45°斜投,带自然光与软阴影。

对于财报这种长文档,Nano Banana Pro 也能直接转成信息图

提示词模版8】:

读取英伟达Q3财报PDF,提取营收、毛利率、同比增长、主要营收来源、风险提示,生成一页信息图:左侧大图展示营收趋势折线,右侧罗列5条要点并配简图标,底部给出一行“结论(一句话)”。

教学分镜/视频脚本。Nano Banana Pro可以完成高级文本渲染与信息图表生成,整合世界知识与谷歌搜索,即将支持4K超清输出,增强合成功能,最多支持6张输入图像。

提示词模版9】:

把下列教学文本拆成6个分镜:每个分镜写明画面要素、旁白要点、需要展示的关键数据或图示,输出为16:9分镜表格,便于直接给视频制作团队使用。

▲【提示词】:

画一幅展示T细胞激活并完成完整信号级联过程的示意图,只需要描述交互和信号显示。

总的来说,Nano Banana Pro的发布,标志着AI生图真正进入“专业成片”时代。

它能直接生成广告级成片,文案、排版、光影、构图同时拉满,完成度也彻底摆脱了过去那种带着玩具感的 AI 出图效果。

一张图就能满足业务需求,效果真实、高级、可直接交付,也难怪它能在短时间内迅速出圈。

作者:硅基君

来源:硅基观察Pro

]]>
顶流设计Agent能用Nano Banana Pro了! //www.f-o-p.com/376877.html Wed, 26 Nov 2025 06:21:08 +0000 //www.f-o-p.com/?p=376877

 

两个AI顶流终于是碰到了一起,这回设计师们真要慌了但也可能是大意过望了——

因为Lovart,这个顶流设计师Agent,现在已经正式接入Nano Banana Pro了!

就拿做海报这件事,不论你有没有设计技术傍身,只需要“脑洞大开+一句话”即可。

例如我们拿着一张女团BlackPink的合影和一张东北雨姐的照片,附上一句Prompt:

把BlackPink里的四个人物的面部全部替换为东北雨姐的面部特征,发型不变;以及上半身衣服变成东北雨姐的花棉袄,但BlackPink所有成员的姿势不变。然后再在海报合适的地方添加“DIE π IN YOUR AREA”字样。

△图片由AI生成

而要调用Nano Banana Pro也是非常简单,一个@的动作就搞定了:

不仅如此,我们还可以用自然语言继续在Lovart中调用更多的模型,利用Sora 2来生成一段视频。

请欣赏女团版东北雨姐演绎神曲《大东北》。

就这个小feel,老蒯(东北雨姐老公)看了也得直呼一句:“带派不老铁!”

而且这个Lovart的名气可谓是不小,不仅是全球首个设计Agent这么简单,在今年5月版本测试阶段就有拿下5天排队10万人的名场面。

7月份正式上线仅2个多月时,Lovart9月份的ARR(年度经常性收入)已经突破了3000万美元大关、DAU(日活跃用户数)冲到20万,在设计垂类的AI应用中,绝对称得上是现象级的产品。

不仅如此,在Lovart接入Nano Banana Pro之后,不少人觉得相比谷歌“直出结果”,Lovart所提供的“无边画布+二次编辑”模式,体感上要好得多。

像在刚才的例子中,我们就是在一个画布里进行的生图、改图、生视频,所见即所得,多模态上下文处理得更好,想改哪里就改哪里;而且Lovart还出了个Touch Edit功能,点两张图的细节就可以替换元素,着实是好用得一批:

如此好玩的AI应用,老规矩,一波深度实测,走起~

有手就能搞专业的设计

说到调用Nano Banana Pro,除了刚才提到的@的方式之外,在输入框右下角的模型选项中,我们也可以对它进行勾选。

选中之后,接下来就可以一直调用Nano Banana Pro;我们也可以同时一块勾选其它视频、3D模型,一口气完成多个任务:

14张图片元素可以一锅出

在Lovart里搞设计,一个体感上的“爽点”,便是它支持一次性处理14张图片的元素。

例如在下面这个实测中,我们导入了12张黏土风的生肖图片,一张透明玩具盒,以及一张商品橱柜图片:

然后我们要做的就是把这14张图一口气处理成一张完整的玩具展示效果图,Prompt如下:

不到1分钟的时间,一张高清的十二生肖玩具陈列图就这么水灵灵地诞生了!

△图片由AI生成

不难看出,Lovart在Nano Banana Pro加持之下,不仅精准理解了我们的意图,而且还根据视觉效果,自行调整了展柜的视角,让玩具能够更清晰地呈现。

还有个操作上的细节值得注意。

刚才我们是用@的方式,把十二生肖挨个给圈了出来,但其实Lovart还提供了“创建编组”和“合并图层”的功能,可以把众多素材合并起来一块用。

独家新功能:Touch Edit

在搞设计的过程中,不少设计师头疼的一点,或许就是对细节的反复修改了。

Lovart针对这个问题,独家推出了一个超级方便且实用的功能——Touch Edit。

不是你以为的抠图或涂抹的形式,而是一个简单的点击动作,Lovart就能自行理解整个画布中各个元素的关系,然后在不破坏整体结构的基础上,严格执行你的要求。

例如在Mac中按住“command+单击”(Windows中是“Ctrl+单击”),就可以精准把控要修改的细节:

同样也是“啪的一下”,这双绣花鞋就稳稳地穿在了女模特的脚上:

△图片由AI生成

以及在操作上,左侧导航栏的下拉菜单中也是可以选取的哦~

这也就不难理解,为什么很多人会认为“Lovart+Nano Banana Pro”的体验,要比直接用谷歌强得多了。

因为有了Touch Edit功能,你不用再抽卡式地去赌Prompt的运气,更不用费劲脑汁去想Prompt描述得够不够准确。

如此一来,设计师们在面对更加复杂的图时,再也不用担心AI“牵一发而动全身”的bug了。

这个新功能,带派,相当带派了!

还能把图片给“炸”开:拆图层来编辑

除了Touch Edit之外,Lovart还有一个编辑图片的功能也是相当的给力——编辑元素(Edit Elements)。

真就是把图片里的背景、文字以及各种元素全部“炸”开,逐层可编辑。

操作依旧是非常简单,只需要在画布中选中一张图片,它的上方便会弹出一个选项栏,“编辑元素”就在其中。

点击“编辑元素”后,Lovart便开始处理、分析这张图的各种细节:

然后我们就可以对这张图进行任意的修改,例如修改文字的字体、大小和颜色:

当然,图片中的各类食材元素也是可以做修改,例如改变大小和位置等等。做PPT、报告,生成即成品

也正是有了强如Nano Banana Pro这样的模型,以及Lovart自身独有的编辑优势,它俩的“合体”可以说是让AI生图能真正做到了实用。

例如你是一位AI老师,要给学生们讲解Transformer相关的内容,那么你现在只需要这么一句Prompt:

做几页连续的PPT,大小16:9,风格保持一致,讲解Transformer。

来,请欣赏AI在1分钟内搞定的PPT:

△图片由AI生成

当然,若是你对其中的某些细节不太满意要做修改,里面的内容不论是用Prompt或者“编辑元素”的方式,均可以轻松修改。

如此一来,我们就无需花太多时间在“调教AI”这件事上,可以把更多的精力用在内容和创意的打磨。

再如复杂的内容可视化,Lovart也是能够轻松hold住:

△图片由AI生成

嗯,效果真的是相当“哇塞”了。

不仅是图片,视频也能搞

除了Nano Banana Pro之外,我们也可以看到Lovart还支持超多的其它模型,涵盖图片、视频和3D。

如此一来,联动玩法,便成了Lovart的另一大亮点。

例如我们就着二者联动的消息,先生成一张新闻播报的图片:

△图片由AI生成

然后在画布中点击左侧导航栏中的“视频生成器”:

再选择想要用到的模型,以及输入要生成视频对应的内容,一段有趣的新闻播报就诞生了。

当然那,我们也可以像文章开头的例子那样,直接把多个素材丢进画布里,同时调用多个模型,让视频“一锅出”。

总结来看,不论是图片设计还是视频制作,在Lovart上的体验可以说是非常得丝滑。

这不仅仅是得益于诸多SOTA大模型本身的能力,更是Lovart独有的操作方式,让生成的结果变得更加可控,最终的效果也趋近于成品;若是用一个公式总结或许就是:

效果逼真 + 细节可控 = 可直接商用

作者:量子位

来源:量子位

]]>
Nano Banana Pro:双十二海报的“降维打击”制作指南(超10种场景+提示词) //www.f-o-p.com/376797.html Wed, 26 Nov 2025 01:10:32 +0000 //www.f-o-p.com/?p=376797

 

朋友们,昨天晚上科技圈又“炸”了,Nano Banana Pro 全量发布。 可能很多人听到这个名字,第一反应是:“这又是什么新出的硬核参数?” 别急,把它那些晦涩的术语——什么 4K 原生分辨率、什么“Thinking”推理模式——先放在一边。作为使用者,我们只需要知道相比上一代(Flash Image),这一版最大的变化其实就两件事:

  • 第一,它终于看懂「人话」了。你不再需要非常复杂的 Prompt去教它做事。
  • 第二,它终于有了「审美」了。那些让我们头疼的“多长了一根手指”、“眼神空洞像恐怖片”的问题,在 Pro 版本里,这意味着你不再需要到处找 Upscaler 插件去修复画质,也不用因为细节画崩了而在这个深夜疯狂抽卡。

这不,双十二马上就要到了。我知道,对于很多做电商、做私域的朋友来说,这几天是最焦虑的。海报还没做,设计排不过来,外包又贵又慢。

所以,今天我不讲大道理。我就想赶在双十二前夕,用这套“未来”的工作流,手把手教你最低 成本撸一套高转化、强风格的店铺海报。

场景实战:给你的商品穿上“情绪”的外衣

做海报,最怕的就是“千篇一律”。以前的 AI,不管你让它画什么,出来都带着一股浓浓的“塑料味”或“硅基味”。但 Nano Banana Pro 最让我惊喜的,是它对材质风格的理解。

为了证明这一点,我特意挑选了10个不同行业的真实场景,我们不仅是换个商品,而是要针对不同品类,调整风格和材质,真正实现精准的“千人千面”。

你可以看看,哪一款适合你?

1. 服装/针织

如果你是卖毛衣、围巾或者棉麻制品的,别再用那种冷冰冰的棚拍图了。我们需要的是温度,是那种隔着屏幕都能摸到的柔软。

  • 风格流派:温暖日系手账风 (Scrapbook & Cozy)
  • 画面中心:模特局部特写,穿着康宝莱花式纱线织成的开衫,手捧一杯热可可
  • 关键元素:画面边缘有毛线缠绕的边框效果,背景散落着纽扣和干花
  • 文案字体:像是绣在布标上的刺绣字体

2. 美妆/护肤

护肤品卖的不是成分,是憧憬。我们要用极简的视觉语言,传达出那种高级的呼吸感。

  • 风格流派:极简拼贴艺术 (Minimalist Collage)
  • 色彩心理:低饱和度的莫兰迪粉与奶油白
  • 画面中心:精华液瓶子放在粗糙的素描纸上,周围贴着花瓣标本
  • 光影氛围:通透的玻璃质感光泽,水光肌般的清透感
  • 文案字体:纤细优雅的钢笔手写体,写在半透明的硫酸纸素材上

3. 母婴/亲子

对于妈妈们来说,没有什么比童真更有杀伤力。我们要避开过度修饰的网红风,回归绘本般的纯真。

  • 风格流派:童趣蜡笔绘本风 (Crayon Illustration)
  • 画面中心:妈妈和宝宝在搭积木的实拍图(或超写实生成),背景处理成蜡笔涂鸦的梦幻城堡
  • 关键元素:各种可爱的卡通贴纸、圆润的边框、柔和的云朵形状
  • 文案字体:稚嫩可爱的蜡笔字,歪歪扭扭但清晰可读

4. 食品/零食

食物的灵魂在于锅气和碎屑。太干净的食物图是没有食欲的,我们要制造一种刚刚出炉的现场感。

  • 风格流派:杂志食谱剪报风 (Vintage Recipe Journal)
  • 画面中心:俯拍视角,刚出炉的坚果/糕点,旁边放着撕下来的旧报纸和银质叉子
  • 关键元素:食物碎屑、咖啡渍印记(增加真实感)、牛皮纸底纹
  • 光影氛围:诱人的暖色顶光,强调食物的酥脆感
  • 文案字体:黑板报粉笔字风格,写在旁边的小黑板素材上

5. 家居/收纳

家居用品卖的是生活方式。不要只展示收纳盒,要展示收纳后的那份井井有条的小确幸。

  • 风格流派:拍立得生活记录风 (Polaroid Lifestyle)
  • 画面中心:一个整洁温馨的客厅角落,三张不同角度的“拍立得照片”叠放在木桌纹理背景上
  • 关键元素:木纹、棉麻布料、金属长尾夹、手写的日期标注
  • 文案字体:油性马克笔直接写在拍立得相纸的下边缘

6. ⛺ 户外/露营

露营是成年人的探险。海报要有一种“在路上”的粗粝感和自由感。

  • 风格流派:自然探险手记风 (Explorer’s Journal)
  • 色彩心理:森林绿、大地咖、营地火光的暖橙
  • 画面中心:露营帐篷与星空,被处理成一张贴在旅行笔记本上的照片
  • 关键元素:指南针草图、等高线地图纹理、压扁的枫叶标本
  • 文案字体:像是印章盖上去的复古印刷体

7. 数码/3C配件

科技不仅仅是冷光,还可以是赛博朋克与手工纸艺的碰撞。这种反差感,最能抓年轻人的眼球。

  • 风格流派:赛博朋克与纸艺的碰撞 (Papercraft Cyber)
  • 画面中心:耳机或手机壳,但周围不仅是科技光,还有被撕开的金属箔纸纹理
  • 关键元素:故障艺术(Glitch)风格的贴纸、电路板纹理的胶带
  • 光影氛围:冷暖对比光(蓝紫VS橙红)
  • 文案字体:像素风字体(Pixel Art Font),带有发光效果。

8. 教育/图书文创

知识是静谧的。我们要还原深夜书桌前的那份专注,让读者看到海报的一瞬间,心能静下来。

  • 风格流派:知识分子的书桌 (Intellectual Desktop)
  • 画面中心:摊开的书本,戴着眼镜,旁边有一杯茶。书本内容即为产品
  • 关键元素:钢笔、墨水瓶、用来做标记的荧光笔痕迹、便利贴
  • 文案字体:经典的衬线宋体,像是印刷在旧书页上的感觉。

9. 珠宝/饰品

珠宝需要的是“贵气”。丝绒的哑光与金属的高光形成的极致对比,能瞬间拉高产品的客单价感。

  • 风格流派:丝绒剪贴簿 (Velvet Scrapbook)
  • 色彩心理:深夜蓝、酒红、金色的奢华感
  • 画面中心:戒指或项链放在丝绒首饰盘中,极度微距
  • 关键元素:金粉散落的效果、蕾丝花边、珍珠光泽的贴纸
  • 文案字体:烫金工艺字体,自带金属反光。

10. 传统茶饮/国潮

新中式不是老气横秋,是东方的雅致。水墨晕染和朱红印章,是刻在中国人DNA里的审美密码。

  • 风格流派:新中式拼贴 (New Chinese Collage)
  • 画面中心:一套茶具,背景是宣纸的纹理
  • 关键元素:水墨晕染的痕迹、红色的印章(这在Nano Banana Pro里渲染极佳)、扇面元素
  • 光影氛围:朦胧的东方意境,烟雾缭绕
  • 文案字体:苍劲有力的毛笔书法体

核心工具:把“想法”变成“画面”

看到这里,你可能会问:“瓦叔,这些图是很有感觉,但我不会写提示词怎么办?” 别担心,我把这把「钥匙」直接交给你。 这是一套基于 Transformer 注意力机制优化的 全中文结构化提示词母版。你不需要懂代码,只需要像做填空题一样,把括号里的内容换成你自己的产品。

Core: The Master Prompt (万能母版)

(请直接复制以下代码块到对话框中)

# Role (角色设定)

你是一位精通视觉营销的电商设计总监,擅长使用混合媒介(Mixed Media)和手账拼贴艺术,能够将商业诉求与艺术美感完美平衡。

# Context (任务背景)

现在是“双十二”年终大促,需要制作一张高转化率的店铺主图(海报)。

# Visual Style (视觉风格基调)

风格流派:[此处填风格,例如:温暖治愈的手账剪贴簿风]

色彩心理:[此处填色调,例如:米色暖调,点缀复古红]

关键元素:[此处填元素,例如:撕纸边缘、和纸胶带、手写便签]

# Subject (画面主体与构图)

画面中心:[此处填商品或场景,例如:一件挂在木衣架上的粗棒针织毛衣]

光影氛围:[此处填光影,例如:冬日午后透过窗纱的柔和侧逆光]

细节质感:请重点刻画材质的纹理(如纤维感、光泽感),使其触手可及。

# Typography (文案与排版 – Nano Banana Pro 特性)

请在画面留白处(遵循三分法构图),自然地融入以下文字内容。文字不要浮在表面,要拥有物理质感(如写在纸片上、绣在布上)。

主标题:“[此处填大标题,如:双12·暖冬]”(字体:[此处填字体感,如:粗头记号笔手写体])

副标题:“[此处填小标题,如:满300减50]”

# Technical (技术参数)

宽高比:3:4 (适合手机屏)渲染精度:Ultra-High Definition, 4K, 8k textures特殊指令:Thinking Mode On (先思考构图再生成), Text Legibility High (文字可读性极高)

Pro Tips:给你几个小建议

1. “Thinking Mode” 的妙用:这是一个隐藏大招。在母版 Prompt 的开头,你可以加一句私货:“请先分析目标用户(比如25-35岁精致宝妈)的审美偏好,再进行构图。” Nano Banana Pro 会在后台像一个真正的设计师一样先进行逻辑推理,生成的图片会更为精准。

2. 文字容错:虽然 Pro 的中文能力已经很强了,但它毕竟不是个文本大模型。如果字数太多,它容易出现乱码。建议主标题保持在8个字以内(如:双十二年终盛典),副标题用小字,这样成功率几乎是100%。 去哪里跑这个 Prompt? 我自己实测下来,非常推荐大家去https://flowith.io/网站上去跑。速度快,交互体验顺滑,而且对这个模型的支持优化做得非常好,真的谁用谁知道。

写在最后

说真的,我写这篇文章的时候,看着窗外的晨光,心里其实挺感慨的。 我们这代人,好像总是在追赶。追赶流量,追赶算法,追赶一个又一个风口。

有时候跑得太快,都忘了当初为什么出发。

我把这套方法分享出来,不是为了让你变成一个操作机器,而是希望这些工具能帮你省下那些重复、枯燥的时间。省下来的时间去做什么呢?去好好打磨一下你的产品,去多陪陪家人,或者,仅仅是在这个寒冷的冬季,早点关上电脑,给自己煮一杯热茶。

技术是冰冷的,但使用技术的人是温暖的。

希望这个双十二,你的店铺不仅有漂亮的业绩,更有一份从容和自在。 我是瓦叔,我们下次见。

作者:靠谱瓦叔

]]>
Nano Banana Pro免费渠道分享+36个实测案例,真炸! //www.f-o-p.com/376767.html Tue, 25 Nov 2025 01:10:40 +0000 //www.f-o-p.com/?p=376767

 

先放福利再贴实测图

不废话直接放大招,目前体验Nano2最稳定的!免费!渠道!

这个活动是我最喜欢的设计Agent:Lovart放出的福利,Nano Banana Pro 全员免费,三天 0 积分使用,畅用不扣积分,不需要充值VIP,只要你登录Lovart官网:https://lovart.ai

就可以在11.21–11.23  随!便!用!

如果你已经开过了Lovart的 Basic 及以上会员,还可以在会员有效期内享受Nano Banana Pro 365 天 0 积分无限量。要知道使用其他模型可是需要扣积分的,而最新的Nano Banana Pro是0 积分!新老会员同享,主打一个不让任何朋友吃亏。

你以为这就完了?还有!

Nano Banana(NB1)、Seedream 4、Midjourney v7 等多个模型同步享受 365 天 0 积分无限量使用。规则和上面一样。

好了福利说完了,下面带来Nano Banana Pro(就是Nano2)的多个实测案例,让没时间自己测试的朋友看看真实效果。

一、如何在Lovart中使用Nano2

很简单,打开官网https://lovart.ai,然后进入项目页面,创建一个新项目

然后在输入框里面@Nano2 , 然后写上你的需求就可以开始生成了

二、36个Nano2在Lovart中的实测案例

一起看看Nano2+Lovart能碰撞出什么火花~

1、电子产品拆解

这个任务主要是为了测试Nano2在非常复杂的零件进行可视化及文字说明方面的能力,效果非常震撼。

由于我在生成的过程中只写了比较简单的提示词,所以有部分文字是模型自由发挥的,如果在提示词中提供了详细的文案,那么结果会更好一些。

2、招聘信息卡片

作者自己最近也在想招聘一个新媒体运营助理,也找了学校的老师帮忙发招聘信息,但是纯文字版非常不易读,这里直接生成两张招聘信息的卡片。

卡片使用了新米泰风格和小清新配色,指令遵循能力完全符合提示词中的要求。

3、PPT生成

这个测试案例中,我没有指定具体的文字内容,只给了主题【如何避免焦虑和内耗】。

随后我又要求把焦虑和内耗两个关键词分成两页PPT,同时增加一些文字内容。下面是结果。

可以看到3张PPT的风格非常一致,即使不是同一次生成的,风格迁移能力也非常强。同时让我非常惊喜的是文字生成的能力。

之前绝大部分产品中生成文字都非常容易变形,尤其是文字比较多的情况,这里面三页PPT我挨个字检查了,没有发现变形的。而且多个段落都没有错乱发生。

4、复杂场景+人像

之前有一个比较火的玩法是:生成一个人在电脑桌面上的播放器里面的画面。这次直接搞一个更复杂的:电脑桌面+播放器+人像的无限循环。

这里面有一个细节是无限循环中的人像,人脸一致性非常好。而且对于越内层的显示器来说,人像的角度实际上是有差别的。但是每一张人像都非常一致。

5、产品+设计全景图

这个任务中,我分别测试了苹果设备和小米设备,针对这两张图,我并没有分别输入对应设计风格的提示词,而是要求模型按照产品本身的调性去进行设计风格的选定,以及最终的输出。可以看到这两张图片,还是很符合苹果和小米的设计风格的。

6、硬件品牌设计

这个任务中测试的是同一品牌家族,不同设备的设计风格一致性。

7、推理+场景融合

这个任务非常有意思,我指定的是一道初中物理习题,然后把解题过程写在黑板上,大家看看结果怎么样。对于模型来说,这样的任务不仅考验的是生成图片的能力,而且还包含很多其他推理的过程。

8、电商宣传图

我上传的是在百度图片中随便截的图,然后要求Nano2生成电商平台所需的多角度宣传图。

最终的结果不仅生成了多角度的图片,而且还给了尺寸的标识。尺寸的标识除了数字标注之外,还使用了一些参照物的形式,更清晰的体现。

这个任务中实际上生成了很多张图片,直接放一张全部图片的集合给大家看一下。

我发现生成图片数量比较多的时候,Lovart的体验也特别好,采用这种无边画布的形式可以支持更多个任务同时显示,更多个素材的堆叠,包括长图创作都非常方便。结尾会放一张所有测试任务的大合照来感受一下无边画布。

9、超跑海报+修改文字

在真实的设计工作中,往往需要对设计稿的细节做一些修改。例如最常见的就是修改文案,这个任务中,我先是生成了一张超跑的宣传海报,带有简单的文字。

然后我再使用Lovart的图层分离功能修改文字,这样就可以实现把生成的图片拆成不同的图层,文字也可以直接修改了,这个能力还适合小范围的替换、细节修图、等等需求。

测试到这里,实际上已经包含了非常多种任务类型了,后面的案例就不再过多添加描述,直接给大家展示Lovart+Nano2实现的真实效果。

10、待办APP的UI设计

11、毛绒APP图标

12、钢铁侠主题美漫

13、风景创意 – 自然场景

14、人物创意 – 角色设计

15、建筑设计

16、美食摄影-近距离特写

17、动物摄影

18、室内设计

19、幻想艺术

20、时装设计

21、包装设计-巧克力

22、平面设计

23、包装设计

24、网页设计

25、品牌VI设计

26、3D渲染

27、UI组件库

28、展览

29、空间光影

30、复杂多包装

31、概念产品创意

32、展览导视系统

33、响应式设计

34、色卡+宣传册

35、原型图

36、广告牌

大合照

测试完成!最后别忘了只要登录Lovart官网:https://lovart.ai  ,就可以在11.21–11.23 0积分 随便用Nano2!

作者:杜昭

来源:AI高手杜小虎

]]>
谷歌Nano Banana Pro的N种邪修玩法,拿去! //www.f-o-p.com/376734.html Fri, 21 Nov 2025 06:50:55 +0000 //www.f-o-p.com/?p=376734

 

我知道,你可能还在Gemini 3的“炸裂”中惊魂未定。

但现在,请系好安全带,因为Nano Banana Pro(也就是大家口中的NB 2)来了。

官方说,Nano Banana Pro是专门为解决最具挑战性的图像生成任务而生,基于Gemini 3 Pro模型训练,带来了更强的推理能力、世界知识、实时信息生成能力、多轮图像生成能力,以及新的图片编辑功能(可改变相机角度、场景光线、景深、对焦等)。

省流:NB 2=Double 牛逼。

在前端死了第8回的次日夜晚,设计师又阵亡了第13次。

当前状态:卧槽?寄!

一手实测:既是测试,也是玩法分享。

测试平台,还是我们的老朋友:Lovart(不要魔法)。

访问lovart.ai,关掉自动,勾选模型Nano Banana Pro。

可以免费体验Nano Banana Pro,三天。如果订阅Basic及以上会员,则送365天Nano Banana Pro无限量使用。

Lovart有个好处是,它有独家的画布编辑功能+其他模型配合(比如视频、3D、音频等)

那接下来,我们这就开整。

1)中文海报

第一个,我想测的就是中文能力。我们知道,上一版其实并不支持中文,我想知道这一版的中文能力到底怎么样了。

用上我的祖传提示词。

一张专业、高品质的PPT封面设计,文字:
{
纳米香蕉
谷歌就是牛逼
}
画面现代且优雅,布局简洁,层次分明。
具有3D空间感、细腻的渐变、柔和的光影效果和电影级氛围。
整体画面风格应自然贴合内容主题(如果是科技 → 融合未来感UI元素;如果是商业 → 抽象的企业几何造型;如果是自然 → 有机纹理与山水氛围;如果是艺术/人文 → 高级配色与典雅图案)。
大厂级审美,精致、简洁,高级感强,视觉冲击力突出但不杂乱。
尺寸16:9。

这效果可以啊。再来一个,竖版的海报。

大师级排版海报设计,画面展现一片广阔的荒原,一条笔直的公路延伸向远方,尽头是一轮巨大的橙黄色落日,天空和荒原被落日染成暖橙与金黄的色调,整体氛围辽阔且充满希望,对称构图,一辆吉普车穿行在公路上,宏大场景。
画面底部有白色潇洒灵动手写风格的文字“即刻启程 奔赴山海”,部分笔画连笔,粗细变化丰富,字迹错落分布。画面中还有黄色小字英文装饰“begin”,3:4比例。(提示词参考@轩轩)

卧槽,追上即梦了啊。

继续上难度,考考它对连续生图的支持情况,这刚好也是Lovart这个Design Agent的优势。

创作4张分别是春分、夏至、秋分、冬至的“四时更替”海报,白色背景,每张对应相应的季节色彩,整体风格保持一致,画面效果和排版方式一致。

看到这里,我知道你可能想说:这有什么了不起的,这不即梦也可以做嘛。

在一边测的过程中,我就一边在想,既然Nano Banana Pro是基于Gemini 3 Pro训练,那么他的推理能力、世界知识应该很强吧。

于是,Prompt就有了。

生成重庆的旅游指南,手账形式,纯中文。

生成一张可视化的图片,展示我在武汉旅游的2天行程。

参照词典,生成“耄耋”的词语解释。

参考中国语文课本,为古诗《黄鹤楼》生成一页课文,诗、拼音、注释一应俱全。

为什么外国人做了一个这么懂中文的模型?而且,这些提示词都是超级简单。

卧槽,我还能说什么?

2)GUI二创

GUI(Graphical User Interface),是指图形用户界面,比如我们在电脑、手机里看到的各种界面,这些通通都属于GUI。

没记错,Gemini 3 Pro在GUI识别这块,是碾压级的存在。

就是这个ScreenSpot-Pro榜单,专门用来测试模型的GUI识别能力,Gemini 3 Pro成绩72.7%,Claude 4.5是36.2%,而GPT-5.1只有3.5%。

所以,我们上提示词。

生成一张Windows XP的桌面截图。要求包含:经典草原背景、左下角“开始”按钮、一个打开着“我的电脑”窗口,窗口内文件列表的字体和图标必须还原Windows XP风格。(提示词参考@AIGC新知)

生成一张Windows 11的桌面截图。同时打开着三个窗口:一个半透明的“设置”窗口、一个Google Chrome浏览器窗口和一个“我的电脑”窗口。要求窗口阴影和层级关系正确,窗口标题栏中的中文准确。

其实,仔细看,在一些中文字生成上,还是有“鬼画符”。但上一版是完全不会中文,谷歌不到3个月就提升这么大,是真的强。

生成一张最新macOS的桌面截图。要求:顶部菜单栏清晰显示WiFi、时间(0:23 AM)和电池图标,桌面上正打开一个Chrome浏览器,里面是马斯克推特的主页。

英文这块,就完全没问题了,无论字多字少,基本没有“鬼画符”。

参考这张图,生成一张类似风格的UI,主色调改为橙色。

OpenAI说:我黄(慌)了……

测到这,我能想到,嗯,那个……也真的太容易了吧?

卧槽,千万别用Nano Banana Pro去作恶啊!千万别做!千万别作!!

3)动漫分镜图

这个Prompt参考自@阿真,主题和主角可以自由修改。

生成像《灌篮高手》那种专业分镜结构、漫画叙事节奏、对白气泡、拟声词、画格布局、视角变化、动态镜头,但主角换成 詹姆斯 和 库里 在NBA总决赛喷垃圾话的故事,中文对白。

詹库对决,这话题度拉满。

就是,这左下角怎么有个bilibili?看来,谷歌没少拿国内数据做训练啊。

4)游戏界面

游戏界面对UI的要求非常高,这也是设计师从业最多的行业之一。

我们看看Nano Banana Pro对人物、特效和游戏数值的精准控制情况。

生成一个《黑神话:悟空》的游戏界面,天命人身着全套大圣套装,正在与二郎神激战。

生成一个《英雄联盟》的游戏界面,多名英雄正在水晶团战,水晶就差一刀被秒掉。

生成一个《剑网3》战斗界面截图。要求:屏幕左上角显示玩家和目标气血/内力条(显示中文数值,如:气血 95%);屏幕下方显示技能快捷栏,其中三个技能处于中文冷却倒计时状态(如:‘冷却:12s’);右下角显示聊天窗口,内容为中文游戏对话。(Prompt by AIGC新知)

5)小红书封面

我个人预判,小红书的封面和配图,可能会是Nano Banana Pro最先落地的场景。

因为,以后生成小红书封面,真的只要一句话。

生成通勤OOTD穿搭主题的小红书笔记封面,尺寸3:4,内容:“打工人一周穿搭不重样💼5套显瘦又高级的通勤look,懒人直接抄作业!”

生成租房改造vlog主题的小红书笔记封面,尺寸3:4,内容:“500元爆改出租屋🏠从老破小到奶油风小家,房东都问我是不是换了房子!”

生成学生党平价彩妆主题的小红书笔记封面,尺寸3:4,内容:“百元搞定全脸妆!💄学生党必入的5款平价彩妆,效果堪比大牌✨

生成旅行拍照姿势主题的小红书笔记封面,尺寸3:4,内容:“海边怎么拍才不游客照?🌊9个超显腿长的拍照姿势,闺蜜夸我像杂志模特!”

生成周末Citywalk路线推荐主题的小红书笔记封面,尺寸3:4,内容:“成都建设路漫步地图🍃咖啡+书店+小众美术馆,一天拍出99张氛围感照片!”

文案,你也不用自己想,直接按我设计的这个格式发给任意AI即可,比如千问。生成xx主题的小红书笔记封面,尺寸3:4,内容:xxx。

6)万能的手账风格

来自Gemini 3 Pro的强大基模,使得Nano Banana Pro支持各种图文混排、多语言混排、多格式混排,以及你能想象的各种混排。

所以,手账风格天然适合Nano Banana Pro。

比如这个参考自藏师傅的提示词,它混杂了真实图片、虚拟图片以及多语言。

帮我生成一张拼贴手账风格的成都旅游笔记,上面记录着自己的行程以及路上的照片等,文字同时配备中文、韩语和英语。

用一幅图介绍堆排序算法流程,用小黄脸的表情包来可视化展示, 表情越开心,代表数值越大,并提供伪代码,手账风格,4:3尺寸。

手账风格,中文讲解咖啡的制作过程,4:3尺寸。

总之,万物皆可手账。

7)意外之喜

测试中,还有一些意外之喜,竟然无比的真实。

平平无奇的手机拍摄,在一个石碑上刻着李白的《蜀道难》,繁体,行书。

写实风格,一个传呼机屏幕写着:不好,香蕉来了。

画一个Transformer的架构图。

写在最后

测了一整晚,从昨晚10点到凌晨4点。

这是我,第一次对一个模型感到害怕 。这种害怕,不是因夜晚的气温骤降而冷得发抖,而是对一个模型的边界感到不安。

似乎,有一种人类即将失守的寒意,正要倾泻而来。

以至于,有很多case我都不能把他们放出来。因为,这个模型“从有生无”的能力实在太过强大,有着一种难以描述的越界感。

仿佛我不是在测试一个模型,而是在窥视一个正在形成的新物种。

所以,我已对全文做了标识:

本文所有图片,均来自人工智能生成。

而测试平台,来自lovart.ai

作者:沃垠AI

来源:沃垠AI

]]>