nano banana – 青瓜传媒 //m.clubpenjuin.com 全球数字营销运营推广学习平台! Mon, 02 Mar 2026 05:46:20 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.2.21 https://static.opp2.com/wp-content/uploads/2021/04/favicon-1.ico nano banana – 青瓜传媒 //m.clubpenjuin.com 32 32 Nano Banana 2不仅有Pro级画质,还能秒出图 //m.clubpenjuin.com/379753.html Mon, 02 Mar 2026 05:46:20 +0000 //m.clubpenjuin.com/?p=379753

 

昨天谷歌悄悄上线的Nano Banana 2(官方名称:Gemini 3.1 Flash Image),直接把我盼了很久的东西,一次性全给了。

今天我就以第一视角,和大家好好聊聊,这款新Banana到底有多香,和之前的Nano Banana Pro比,到底强在哪,普通人用起来到底爽不爽。

Google DeepMind 在2026年2月27日官宣发布了Nano Banana2。

这里先放两张官方的图片,现在支持这种原生超宽幅比例生成。

提示词:一张我用手机拍的4:1全景照片,展示了我小屋里郁郁葱葱的丛林景色。

提示词:一张我用手机拍的4:1全景照片,展示了我公寓里的景色,夕阳完美,有一排排深红色的卷积云。

想尝试的小伙伴在lovart中就可以使用。

先说说最戳我的一点:速度

最直观的感受:快到离谱,快到忘了在等图。那种感觉就像:你刚说完需求,图已经摆在你面前了。

做短视频封面、朋友圈配图、电商小海报,简直是即时反馈。想到什么就生成什么,不满意立刻改,创作流完全不被打断。对用户来说,不卡顿的节奏,比什么都重要

更绝的是,快不等于糙。很多工具一快就糊、一快就崩,但Nano Banana 2直接把Pro级画质塞到了Flash速度里。简单说:Pro的画质,Flash的速度,一半的价格

下面我带大家再看几个案例体现出模型的不同能力:

这张漫画风格的科普图,用三栏对比的方式,清晰展示了三种最基础的云类型:积云(Cumulus)、层云(Stratus)、卷云(Cirrus),视觉和文字信息都非常直观。

这张水循环示意图用手工拼贴形式。

清晰展示了四大核心步骤:太阳加热引发蒸发,遇冷形成凝结,水汽落下成为降水,最终通过径流回归海洋,完成循环。

相较于 Pro 版的古典城堡风,Nano Banana 2 在几何拼接风格下,能输出更灵动的乡村庄园场景,色彩层次更丰富,背景色块切割更具现代艺术感,在场景多样性与视觉表现力上实现了升级。

Nano Banana 2 具有多主体互动生成与叙事化场景构建能力

仅输入 3 个独立的毛毡质感角色素材,产品即可自动生成 6 张连贯场景图,让角色在统一的森林环境中完成阅读、协作等互动,动作与场景高度适配,实现从单元素到完整叙事画面的跨越。

Nano Banana 2 它精准复刻了苏格兰格伦科峡谷的核心景观 —— 云雾山峰、蜿蜒溪流与静谧湖泊,在保持 4K 超清画质的同时,完美传递出高地苍凉壮阔的氛围,体现了模型对真实世界地理与光影的深度理解。

以及像这种相同人物但是不同比例的物料背景,非常方便。

画质对标Pro:细节、光影、质感,一点没缩水。

很多人会担心:这么快,画质是不是砍了?我拿Pro和2做了十几组对比,从人像、风景、产品到插画,结论很明确:Nano Banana 2的画质,完全对标Nano Banana Pro,甚至在细节上更稳。

并且Nano Banana 2 的光影更通透:不再是平涂的塑料感,明暗层次、反光、阴影都很自然,照片级真实感拉满;

纹理更细腻:布料、金属、木纹、皮肤,放大看都经得起考验,4K输出直接商用;构图更精准:透视、比例、镜头感,你说广角就是广角,说特写就是特写,不偷懒、不瞎改。

如果你是画漫画、做分镜、写故事板,这一点会让你直接爱上它:主体一致性。Nano Banana Pro能做到单工作流保持5个角色+14个物体特征不变,Nano Banana 2不仅继承了这个能力,还更稳定。

同一个角色,换场景、换动作、换服装,脸不崩、发型不变、标志性细节不丢;同一个道具,在不同画面里保持样式、颜色、质感一致;

现在一套提示词走到底,角色全程长相统一。对内容创作者、IP设计师、游戏原画师来说,这简直是解放双手

最主要的提升是,好用还不贵,人人用得起,这件事对个人和小团队来说,成本永远是硬指标。

大厂把专业能力下放,让普通人也能用得起顶级工具,这才是真正的普惠。

作者:为了罐罐

]]>
中文版Nano Banana来了?Qwen-Image-2.0炸场 //m.clubpenjuin.com/379463.html Wed, 11 Feb 2026 02:01:06 +0000 //m.clubpenjuin.com/?p=379463

 

文本一长就糊、指令一杂就撂挑子、遇到中文更是一整个变形freestyle……

「AI生图」的这点苦,到底有谁懂啊!!!

停,不用拧巴了,因为现在的AI,已经能稳稳吃下1K token的超长文字指令了:

复杂指令也不在怕的,最近OpenClaw贼火,我索性让AI直接帮roll出一个赛博信息图海报(你就说牛不牛吧):

中文渲染表现也不孬,《兰亭集序》这种公认的高难度文本,这AI居然能做到文字1:1还原,排版、笔锋都在线:

你以为到这儿就结束了,NONONO!因为它还能——多图编辑

随手丢给了它一张照片,人家直接给我甩出一组影棚级的9宫格写真!!(诶,突然感觉怒省一笔钱…

刚才帮我干活的这位,正是阿里刚刚发布的新一代图像生成及编辑模型——Qwen-Image-2.0

1K token长文本、复杂指令、中文渲染、图片编辑、2K分辨率一次性梭哈,连国际评测里的表现都已经冲到了仅次于Nano Banana Pro的位置。

不废话,这个中文版Nano Banana到底能不能打,咱实测见真章!!!

Qwen-Image-2.0 一手实测

复杂指令理解准,1K token文本玩得转

在AI生图界,最让人崩溃的倒不是写Prompt词,而是写了太多,AI根本不吃消,好的提示词真无!处!施!展!

不知道千问团队受了啥启发,这次在Qwen-Image-2.0中把提示词的输入字符硬生生搞到了「1K token」,而且对复杂指令的生成准确率也上了一个level。

换句话说,现在咱喂进去一大段「七八九百字」的超长地狱级提示词,对AI来说也是《手拿把掐》了。

但老话讲得好,光说不练假把式。

你说1K token就1K token?你说这AI能理解复杂指令就能理解?咱还得实测说的算!

先来道开胃菜,最近水墨风多宫格漫画在网上贼火,我直接反手就是输入一个长达700字,且包含复杂指令的提示词:

这个提示指令的难度在于,既需要AI理解五宫格结构、时间推进、空间切换、人物关系与统一画风,还需要把700字的长文本消化理解到位,这对长上下文保持一致性要求很高!!!

结果还没一分钟,Qwen-Image-2.0就给我搓出来了完成度明显高于我预期的唐僧师徒西天取经的「五宫格漫画」

仔细看会发现,夜行、火焰山、打斗这些场景区分都很明显,而且人物形象稳定,唐僧、孙悟空、猪八戒、沙僧都保持了较好的角色一致性。

连唐僧脸上的emo情绪都还原得很到位,该有的要素一个不差???

(不是,家人们,我有点惊了…)

emm…一张图说明不了啥!

这回咱再试一个Nano Banana里很火的「美食爆炸图」玩法,看看AI能不能接住招!

这次我输入了一段长达600多字的提示词,逐层描述汉堡的十种食材及其上下位置,对AI的结构理解与还原能力提出了很高要求:

万万没想到,一个颜值和完成度都拉满的「商业级」2k分辨率的汉堡分解信息图,就这么被AI搓出来了:

质感自然没得说,牛肉饼的焦化纹理、芝士拉丝、酱汁流动都很真实,文字也没有出现变形问题,每一层食材之间的距离也把控得很完美,强迫症患者狠狠爱了!!!

漫画和美食玩够了,咱再来试试城市特效玩法。

这回咱让AI在「画轴+立体城市+微缩建模+2k分辨率」多重要求同时成立的前提下,生成一幅上海市的3D景观:

说一句不夸张的,这张已经有点巨作内味了,完成度甚至比不少我在网上看到的爆款案例还要高……

从结构上看,画轴与上海城市的结合非常自然,卷轴的展开方向刚好承载了城市纵深。

此外,高楼、道路、水面、人物之间没有明显失衡,夜景灯光、车流光带、水面反射也都处理得很细,这Qwen-Image-2.0属实是把复杂指令和超长提示词妥妥拿捏了…

最后咱再来试试微观景观玩法,让AI搓一个2k微距摄影视角下的「大米王国」

在提示词的设计中,既要求AI将大米放大到地形级的尺度,又要保证微缩人物的比例、动作和受力逻辑真实,还得在同一画面中呈现搬运、装袋、协作的劳动场景,一旦有一项没对齐,画面就会立刻出戏!!!

没失望啊没失望,一个误入米粒世界、微缩人们围着巨型大米忙得热火朝天的奇妙场景,就这么水灵灵被搓出来了:

u1s1,整体完成度还是很高的,微缩比例关系准确,大米的尺度夸张但逻辑自洽,而且米粒的半透明质感、裂纹细节和浅景深处理让画面非常接近真实微距摄影了。

看来,Qwen-Image-2.0的1K token的超长文本输入和复杂指令理解力,还是有点说法的…

多图编辑手拿把掐

有朋友看到这儿该问了,光能文字生图有啥用啊,编辑能力才是最实用的。(大声)

好巧不巧,除了基础的文生图外,这次Qwen-Image-2.0的另一大超实用的能力,那就是——图片编辑

具体讲呢,我们可以通过上传一张或多张图片,通过提示词指令让AI进行二创、修改等编辑操作~

咱先来玩一个NanoBanana超火的OOTD拼图玩法,让图1中的女孩穿着图3的裙子,站在图2的车身前:

别说嗷,真一点违和感没有,衣服和女孩的融合得也非常好,不仅如此AI还把汽车的倒影给补足还原了,666…

咱再来试一个九宫格自拍照编辑玩法,只喂一张照片,再给一句九宫格需求指令,我就得到了一套影棚级写真!

不光如此,人家连文案都给你一块包了,我让AI给第一张水墨画写了首诗,小词一放上去,古风味儿立马就出来了:

能改图、能加字、能拼图,好好好,这下真·万物皆可编辑了。

感觉下个月我P图软件的会员真不用续费了……

中文汉字渲染极夯

其实从Qwen Image模型刚出的时候,我就对它中文渲染的强大能力的《略有耳闻》。

只是没想到,到了2.0,这本事又进化了…..

因为我发现,哪怕一张图都不喂,只简单说了一句「生成一个一文看懂的科普信息图表,解释熬夜的危害」,Qwen-Image-2.0给我的,已经是一张数字、汉字、英文全都安排得明明白白的科普海报了:

此外,它还能将文字和画作进行完整融合,看下面这个雪雕版的冰雪大世界,远看是字,近看是景,文字和周围的积雪融合得恰到好处!

即便黑板报中充满数字、符号和中文,文字依然能够做到1:1还原,更难得的是整体排版依旧规整,每个字的笔锋和间距看起来都很舒服:

汉字完整度和一致性都很高,几乎没有乱码或假字,数字、符号和公式渲染准确,已经达到可直接阅读的水平了。

诶?感觉非常适合拿来处理咱日常的一些海报文案、信息图表内容,这可比自己往图上一个个P字儿快多了…

实测之外,国际表现同样能打

实测中能打,国际表现也不孬。

在AI Arena模型评测中, Qwen-Image-2.0在文生图、图生图两个基准测试里也都跑出了相当靠前的成绩,仅次于谷歌Nano Banana Pro和GPT Image 1.5:

其实回头看Qwen-Image的演进路径,这个结果算不上意外。

早些时候,千问一直在两条方向上同时推进:一条主攻生图能力,一条持续打磨编辑能力

去年8月发布的Qwen-Image更偏向文字渲染的准确性,12月的Qwen-Image-2512则把重心放在细节质感和真实度上,与此同时,从单图编辑到多图编辑,再到一致性能力,也一步步补齐。

到了这次的Qwen-Image-2.0,相当于把这两条路线收拢到同一个模型里,生图和编辑同时在线,整体表现也就更稳了。

以中文文字渲染为例,过去这一方向长期受限于VAE压缩带来的损失:

小字号、密集排版对压缩极其敏感,信息密度越高,重构难度越大,生成结果也越容易糊。

围绕这一痛点,Qwen-Image-2.0在VAE与生成模型两端同步升级,小字与高密度文字场景下的可读性明显提升,PPT、信息图这类场景终于能稳定输出可直接使用的图像。

参数规模上,Qwen-Image-2.0也做了进一步收敛。

在能力提升的同时,模型体量更轻部署门槛更低生图速度更快,尤其适合高频prompt调试、实时展示和交互式创作等使用场景~

站在真实使用者的角度,这次实测下来最大的感受只有三个字——「超预期」。

对我而言,平时看一个生图模型好不好用,从来不太纠结参数本身,更在意它能不能在不反复抽卡的情况下,直接给出让我满意的结果。

这背后包括几个很实际的点:

提示词信息能不能完整呈现、生成速度快不快、画面好不好看,以及编辑能力够不够强大顺手。

而从这次体验来看,Qwen-Image-2.0几乎把这些日常生图时最容易翻车的地方,一次性都补齐了:

1K token的指令支持,让我可以尽可能把提示词写完整;2K分辨率输出,保证了画面的质感;而生图与编辑二合一的能力,让很多修改都能直接在生成结果上完成,省去了咱来回切换其他修图软件的麻烦。

好用、好看、真实、好玩,对我来说这就够了。

目前阿里云百炼上已开通API邀测。

开发者也可通过Qwen Chat(chat.qwen.ai)免费体验新模型,感兴趣的友友不妨直接自己上手搓一把!!!

作者:梦瑶

来源:量子位

]]>
Nano Banana + Veo 3.1 实战SOP:打造一支珠宝广告(案例演示) //m.clubpenjuin.com/378936.html Tue, 27 Jan 2026 05:48:51 +0000 //m.clubpenjuin.com/?p=378936

 

如何组合当下最强的AI工具,以零边际成本交付一支光影完美的商业广告?本文将拆解一套“实用主义”工作流,“一人团队”挑战传统4A公司的产能壁垒。

一、引言:当“光影”不再昂贵

在很长一段时间里,制作一支具有“电影感”的产品广告(TVC),是只有大厂才玩得起的资源游戏。

作为产品经理或运营负责人,你一定经历过这样的至暗时刻:为了验证一个新产品的市场接受度(MVP阶段),你想做一支像样的演示视频。但摆在你面前的是:昂贵的摄影棚租赁费、按秒计费的后期特效、以及长达数周的沟通排期。最后,你往往只能妥协,用几张静态图草草了事,导致转化率惨淡。

现在AI不再仅仅是生成素材的零散工具,而是形成了一条完整的工业流水线。

今天,我和大家分享一套 “Google AI Studio + Nano Banana + Veo 3.1” 的闭环工作流。它让一个人,在4小时内,不仅能做视频,更能做出一支具备商业级光影、严格产品一致性、精准运镜的广告片。

二、组建你的“AI 4A公司”:核心班底介绍

要像专业团队一样作战,首先要理解我们手中的工具分别扮演什么角色。这不再是简单的工具叠加,而是数据流的接力。

首席创意总监 (CCO):Google AI Studio (Gemini 3 Pro)

Gemini 3 Pro 在这里不仅仅是写文案的聊天机器人,它是“视觉翻译官”。

入选理由: 相比其他模型,它对长上下文和结构化数据的处理更稳健。我们需要它将模糊的“奢华感”,翻译成摄影师听得懂的术语(如“伦布朗光”、“浅景深”、“微距特写”),并输出Prompt(据说JSON格式效果更好)。

https://aistudio.google.com/u/1/prompts/new_chat

首席美术指导 (Art Director):Nano Banana

如果你玩过早期的生图工具,一定体会过“抽卡”的痛苦——上一秒戒指还是六爪镶嵌,下一秒就变成了四爪。

入选理由: Nano Banana 目前在“一致性 (Consistency)”上表现出断层优势。它的 Reference Identity(参考一致性)功能,能死死“咬住”产品的物理特征,确保你的珠宝在任何背景下,永远是那一款产品,而不是随机生成的“类似品”。

https://gemini.google.com/u/1/app?pageId=none

首席摄影师 (DOP):Veo 3.1

视频生成的最新一代选手。

入选理由: 它最大的杀手锏是“首尾帧控制” 。商业广告讲究运镜逻辑,Veo 3.1 允许你指定“起点”和“终点”,让AI自动补全中间的路径。这让“指哪打哪”的精准运镜成为可能。

https://labs.google/flow/about

首席配乐师 (Composer):SUNG

目前最比较好用的AI写歌工具。

入选理由:现在用它,你只要输入歌词或者大概的风格描述,它直接就能给你整出一首有前奏、有主歌副歌的完整单曲。不用懂五线谱,不管是口水歌还是大片风,几秒钟就能听到成品,主打一个“拿来就能用”。

https://suno.com/

后期剪辑:剪映

也就是咱们最熟悉的那个“万能工具箱”。

用自己熟悉的剪辑软件就好(剪映、Pr)

三、实战SOP:打造一支珠宝广告(案例演示)

下面以 宝格丽的手链为例,拆解全流程。

Step 1:拿到产品图

第一步先搞定素材。我直接去官网找了一张自己满意的产品高清图。

接下来将产品图粘贴进 Google AI Studio。不要直接对AI说“生成一个手链广告”。作为PM,我们需要定义参数。

提示词可以这样写:

Prompt.01-品牌信息

我正在为 宝格丽的项链 制作广告。我应该如何看待这个品牌?他们的目标客户是谁?他们的美学理念是什么?他们的使命是什么?他们的核心信息是什么?

Gemini 3 Pro会为我们做大量大调研,这将有助于把这则广告整合成统一且契合宝格丽品牌的整体形象。不希望这只是随意拼凑的,实际上希望在每一个环节都非常有目的性。

我们会得到关于品牌的关键信息。为我们详细分析了目标客户、美学风格、色彩搭配和视觉风格。

接下来我们可以用两种方式来处理接下来的问题,而品牌也通常有两种思考方式。一种是能否吸引更多受众,或者第二种能否接入全新的受众群体。

通常大家觉得宝格丽是成熟女性的专属,但我觉得在这例子中打入一个全新的出人意料的受众群体——Z世代活力少女。用青春气息去重新演绎奢华珠宝,既圈粉年轻人,也保留了品牌的独特调性。

接下来的提示词我会这样写:

Prompt.02-创意和调性

我觉得制作一个针对自信、独立、充满魅力的年轻女性人群的广告会很有趣,比如25岁左右的人。我希望它能给人一种,年轻,时尚的感觉。

我会得到这么一段关于广告调性内容。

现在,我们基本已经有了品牌和风格。接下来我们要真正的打磨我们的概念和实际的图像以及视觉内容。

tep 2:角色创建

有两件主要的事情会驱动我们后续的流程。我们需要主角角色和情绪板。情绪板总能给客户留下深刻印象,它能体现你做了充分的调研。以前这需要花费大量时间,而现在我们只需要几秒钟就能完成。

接下来的提示词:

Prompt.03-创建角色

根据这个创意方向,为 AI 图像生成器创建一个图像提示词,用来描述我们的主角。

我们会得到多个提示词选项。所以我们可以实际测试不同的主角角色。

现在我们切换到Nano Banana Pro。第一件要做的事就是上传产品图。这样Nano Banana Pro才能正确识别产品。

然后将得到的提示词,分别复制粘贴上去。这样你就能得到多个主角,然后选出你喜欢的主角形象。

我得到了两个主角形象。Nano Banana Pro 的准确性真的让人喜欢。我更喜欢第二个形象,她将是接下来所有工作的参考。

接下来生成情绪板。

Prompt.04-创建情绪板

这是我们的主角。根据我们讨论的所有内容,为情绪板生成一个图像提示词。像创意总监一样思考——参考图像、颜色、纹理、字体等等。

这样Gemini 3 Pro就为我们生成了提示。

将得到的提示词粘贴下来,复制到 Nano Banana Pro。并上传产品图和主角角色。

现在我们有了所有需要的初始视觉素材,主角、节奏和情绪板。我们可以开始实际构建故事了。

Step 3:故事大纲

现在,根据活动创建故事脚本。

Prompt.05-故事脚本

基于此活动,创建一个包含 7 个镜头的故事线。请像向 AI 图像生成器描述一样描述每个镜头。

我们得到了7个分镜描述词。

接下来继续使用 Nano Banana Pro 来生成分镜。

Step 4:生成分镜

我们的第一个提示词是,一位年轻女子正在将一条宝格丽玫瑰金双链手链戴在手腕上。手链扣上“咔哒”一声的瞬间。光线昏暗的卧室梳妆台,略显凌乱,摆放着化妆刷和香水瓶。镜子中的倒影隐约可见她黑色吊带裙的轮廓。这是一个很好的开场镜头。

现在由于我们已经打好了所有基础,流程这部分会变得非常快。所以我们只需要回来将分镜提示词都复制粘贴到Nano Banana Pro 里,并使用同样的参考图片。

Step 5:制作视频

在得到了所有的分镜图后,可以来生成视频提示词。我发现视频提示词越简单效果越好。

Prompt.06-分镜提示词

为这些镜头中的每一个创建一个AI视频生成器的提示。保持简洁,描述摄 “像机运动和动作。

得到所有的分镜提示词后。

静态图只是PPT,动起来才是TVC。接下来我们将使用Veo 3.1 – Fast。生成速度快,价格也不贵。还有270p(Gif)、720p和1080p三个尺寸下载。

我们采用素材生视频的方式,在有图片参考的情况下,视频提示的效果是很好的。当然也可以采用帧生视频的方式,这可能需要生成更多的分镜。

接下来只需要回到 Gemini 3 Pro 复制分镜提示词,并附带上分镜图。我们就可以得到7个分镜视频。

Step 6:配乐

虽然 Veo 3.1 自带一些音效,但那些声音太碎了,缺乏连贯的情绪主线。为了保证广告的整体完成度,我们需要引入AI音乐生成工具。了统一的配乐,整个广告的氛围感才对味,观众的体验也能直接上一个台阶。

现在回到Gemini 3 Pro,来为音乐生成提示词

Prompt.07-生成配乐

为符合此品牌和氛围的AI音乐生成器生成一个提示。

再得到的提示词中,选择你喜欢风格。然后直接复制到你常用的AI音效产品中。这里我用的是Suno。

我们得到了 4 段完整的配乐,听起来效果都很不错。这里我选的是第一段,它完美契合了整个广告的调性。

Step 7:剪辑视频

现在我们只剩下一件事要做了,就是下载Veo 3.1生成的视频,用自己喜欢的剪辑软件,把他们编辑到一起。通常情况下是不会用到整个8秒钟视频片段,是需要剪出最精彩的部分就行。

让我们看一下成片吧。

点击连接查看完整演示

四、进阶思考:从“做视频”到“做增长”

把视频做出来只是第一步。作为产品经理,我们要思考的是ROI(投资回报率)。这套工作流真正的威力在于它改变了营销测试的逻辑。

极速 A/B Testing 的新范式

传统模式下,拍一支珠宝广告需要几十万预算,一旦风格定型就很难修改。 但在 AI 工作流中,我们可以做“高通量测试”:

  • 变量控制: 保持主体不变(Nano Banana控制)。
  • 多维生成: 生成三种完全不同的氛围——“高冷极简风”、“奢华宫廷风”、“自然森系风”。
  • 数据决策: 一天内产出3支不同风格的短片,小预算投放到抖音或视频号。看哪个版本的完播率和点击率高,就对哪个版本追加预算。这是用数据驱动创意,而非拍脑袋。

“预售”你的概念 (Fake Door Testing)

很多时候,供应链还没准备好,但营销可以先行。 利用这套流程,你可以在产品还在设计图阶段时,就生成以假乱真的实物广告。通过投放测试用户的购买意愿。如果“点击购买”的数据惨淡,你甚至可以砍掉这个SKU,从而节省原本需要投入的开模和备货成本。

视频,在这里变成了最低成本的调研问卷。

五、结语与行动建议

实操中很少能一次完美,中间我也经历了多次‘抽卡’筛选,在有工作流的情况下抽卡次数明显降低很多,试错成本也大大降低。 最后想强调的是:今天展示的这套组合并非标准答案。AI 进化太快了,技术工具会不断迭代,大家完全可以随时替换掉其中任何一个环节,今天我们用的是 Nano Banana 和 Veo,明天可能就会有更强的工具出现。但核心的方法论是不变的:

  1. 结构化思维(用Gemini拆解需求);
  2. 资产一致性管理(确保产品不走样);
  3. 可控的动态演绎(指哪打哪的运镜)。

这套“一人广告公司”的逻辑,本质上是把内容的生产成本降到了边际为零,从而让创意和决策的价值被无限放大。

不要等“学会了”再做。哪怕你手头只有一张随手拍的产品图,现在就去尝试:

  1. 用生图工具给它换一个“百万级”的背景;
  2. 用视频工具让光影在它身上流动起来;
  3. 发给你的团队或客户,看看他们惊讶的表情。

这就是产品经理的执行力。

作者:下个夏天

]]>
Nano Banana高质感海报,我在Lovart上跑通了 //m.clubpenjuin.com/377746.html Wed, 24 Dec 2025 05:50:22 +0000 //m.clubpenjuin.com/?p=377746

 

放假前,我本来是想推荐一些视觉类的AI工具,

比如让审美更高级、能够精准控制画面的、能控制文字的、能帮忙排版二次修改的等等等,帮大家节省“从 0 到选模型”的时间。

我连分类结构都列好了,就在我准备开写的时候被吐槽了,

这些模型每一个都强,都在不断更新,但要一个个用下来,光是订阅套餐就能浪费几天。

完成一张真的能用的图要在不同的工具中切来切去,不断的保存、上传、反复写提示语,这个过程怕不是有点子废人。。。。

与其推荐一大堆零零散散的工具,使用的时候还要在这一堆 tab反复横条,上传下载,

我觉得不妨找一个当前的局部最优解,

一个装下了大部分好用工具的平台,Lovart

一段时间不见,先看看Lovart接入了多少模型!Nano香蕉、即梦4.0、Midjourney V7、海螺02、veo3、新上线可灵2.5、Wan2.5、ViduQ2、Tripo3D等等等等,几乎包括了我现在在用的所有视觉模型。

冷知识,Lovart 的 Basic 以上会员可在会员期内无限使用 Midjourney、Nano Banana、Seedream4,除使用Agent消耗的积分外无需支付使用这三个模型的积分。

🔗 lovart.ai

那也就是说,我可以在Lovart内完成不同模型的自由调度,图生图,再对图进行精修、再排版后再合成视频,这套流程就在一个网页里全搞定!

先看几张我给Lovart做的海报,

在Loavrt里的模型是可以来回切的,

素材不高级,我上Midjourney,

中文不高级,我上Seedream4.0,

多素材融合不彻底,我上nano banana

不需要熟悉每个工具的使用界面,只要在列表里看着这些工具里哪个更适合这一步去做,然后选择它继续去对话就行了。

刚好我最近在学习如何把活动海报做好看,

那一步步来看整个流程,

一张以“触摸未来”为主题的活动海报:

视觉风格具有艺术幻想风格并融入未来科技的元素;

配色要以深蓝色和点缀的星光橙色为主题;

文字信息:

主标题 (最大号)触摸未来

主标题强化 (略小)预见・幻想・无限

副标题 (小号):20年以后世界会是什么样 / The World in 20 Years: A Glimpse into Tomorrow

背景点缀 (艺术体):Digital Rebirth / AI Intelligent Ecosystem / 沉浸式体验 (深色半透明)底部 CTA (加粗):未来已至,你准备好了吗? 跟我一起寻找未来。

右下角二维码:扫码预见 (Scan to See)

能在图上识别出清晰的中英文字体;

右下角要放置一个圆角矩形二维码 + 图标;

可以看到整张海报的主题是将幻想与未来相结合,所以我首先调用骨子里多少带点艺术风格的模型Midjourney V7,然后用上我压箱底的sref code,生成一张幻想风格的图片。

好处就是Lovart可以一次生成非常多的图片供我们选择,而不只是局限于原本Midjourney中一次只能生成4张。这样我们一次性得到了12张极具Midjourney审美风的图片。

但现在的图片看起来还少了一些科技元素,怎么办呢?哪里不会点哪里!

我们挑选一张最喜欢的图片作为主视觉,然后点击这张图选“Add to chat”,再到右边对话栏中选择Nano banana模型,最后写好对这张图片修改的指令。

只能说不愧是Nano banana,在保证原图的一致性的同时,融入了科技光线和代码元素。

视觉图片定稿后,我再用 Seedream4 给图片加中文,依旧是同样的操作,

然后我就得到了这样一张海报,

这样的好处是足够稳定,分成多步生成,以免被甲方改到破防。Seedream很多时候还会预留放2D马的位置,不需要我掏出ps。

最后我还试了一下视频转化功能,用这张图生成一段5s动态海报,把短视频转成live图后又是一个不错的宣传素材。

到这里,一张三模梦幻联动的“触摸未来”活动海报外加一个动态海报就做完了。MJ还是那么有设计感,NanoBanana 还是那么有一致性,Seedream 4.0还是那么会写中文。

我的排比句还是写得那么好。

Lovart还有ChatCanvas二次编辑功能,我们生成的图片再也不是一锤子买卖了,就拿刚刚这张海报找茬,生成完这一版后,我想调整两个细节:

  1. 想修改文字内容(每次验收的固定环节A)
  2. 想在画面中加入一个同样风格的电脑元素(每次验收的固定环节B)

ChatCanvas的用法我们之前在文章里也有介绍,我就不过多解释了,简单来说就是用画笔圈住想要修改的地方聊天就可以了,

设计师听不懂我说话的难题,lovart用一张能聊天的画布解决了

那在这里我就框选好想要修改的文字部分,在对话框里告诉它我要修改成什么内容,

就能得到一张延续原本字体,保持原本画面风格和元素高度一致的修改图片,

在想要添加元素的地方框选好,告诉它想要增加什么元素,

就能得到一张风格前后基本一致的修改图。

还有一手!

如果脑袋空空没啥想法的话,可以直接给Lovart一张海报,让它延续原本的风格,自己推理后批量生成一系列图中元素与文字内容都能一一对应的海报,比如24节气海报,细看它所有的图片元素和标题、短句的内容都是对应的。

生成的所有图片都会显示在一个画布上,非常方便我们回滚、对比、再修改,一目了然。

说到这里,我就想提一下这段时间做AI生图、AI生视频、AI生音频带来的轻微割裂感,好像随着文本类大模型的进阶,我对神级提示语的依赖少了,跟模型对话也变成了有啥说啥,反正它总能返回点什么,但图像好像还是忍不住囤囤囤,囤一大堆提示语,把这一大堆提示语囤成模版,最好可以一口气生成几百个提示语存起才放心,但轮到真正要用的时候,又发现好用的也就那来回几个,我称之为提示语焦虑,这种焦虑又能很好的被工作流冲淡,因为模型够多、够强,不需要担心自己做出来一坨不明物体,喜欢,就去尝试好了,就那么简单。

作者:卡尔 & 阿汤

来源:卡尔的AI沃茨

]]>
Nano Banana使用场景大全 //m.clubpenjuin.com/377692.html Mon, 22 Dec 2025 08:04:56 +0000 //m.clubpenjuin.com/?p=377692

 

AI 图像生成领域正随着 Nano Banana 的出现步入新纪元,以其为代表的技术突破预示着 AI 将从 2D 图像生成向 3D 建模、视频生成拓展。未来,AI 创作工具的商业生态会更完善,AI 创作也将成为数字时代的基础技能,推动各行业向智能化、高效化发展。

1. Nano Banana 概述

什么是Nano Banana

Nano Banana 是 Google 于 2024 年推出的革命性 AI 驱动图像生成与编辑模型,正式名称为 **Gemini 2.5 Flash Image**。这款模型以其前所未有的角色一致性保持能力、闪电般的处理速度(仅需2.3秒生成1024×1024高质量图像)和强大的多模态理解能力,在AI图像生成领域掀起了一场技术革命。

在权威的 LMArena 基准测试中,Nano Banana 的综合评分超越了所有竞品,包括备受瞩目的 Flux Context 等模型。用户普遍反映,该模型在保留面部特征和将编辑与背景无缝集成方面”完全碾压”了现有的竞争对手。

免费使用平台详解

1.LMArena 平台访问方式

直接访问 lmarena.ai

操作步骤

  • 进入平台后将上方的“battle”模式切换为“directchat”
  • 点击界面中的image小图标
  • 系统自动调用Gemini2.5Flash模型(显示为nano-banana)
  • 上传图片或输入文本提示词即可生成

使用技巧:由于是抽卡机制,可能需要多次尝试才能调用到 nano-banana 模型

优势:完全免费,无需注册

2. GoogleAIStudio 平台

访问地址:aistudio.google.com

Token 限制: 32,768个 Token(关闭页面重新打开可刷新)

操作流程

  • 使用Google账户登录
  • 点击“Chat”功能
  • 在下方选择“trynanobanana”选项
  • 输入关键词或上传图片进行操作

特色功能:支持时代穿越写真等预设应用

适用场景:适合需要稳定使用的用户

3. OpenRouter 平台平台特色: 可同时调用多个模型进行对比

版本选择:提供免费版和付费版 nano-banana 模型

使用建议:长期稳定使用建议选择付费版,因为免费版在高峰期可能出现排队或内部错误

格式要求:重要提醒 – 上传图片必须使用 JPG 格式,PNG 格式会导致图片模糊

格式转换:只需将图片后缀从 .png 改为 .jpg 即可解决模糊问题

使用注意事项

  • 目前所有平台都可能出现“internalerror”内部错误,这是由于用户需求量激增导致的服务器压力
  • 建议备用多个平台,确保使用的连续性
  • 图片格式统一使用JPG,避免质量损失

市场地位与行业影响

Nano Banana 的出现标志着 2025 年 AI 图像生成技术的重大突破,被业内专家称为”AI绘画时代的承上启下之作”。它不仅解决了长期困扰行业的角色一致性问题,更是第一个真正打破 Flux Context 在一致性效果方面垄断地位的模型。

2. 技术架构与核心功能

深度学习架构基础

Nano Banana 基于 Google DeepMind 最新的 Gemini 2.5 Flash Image 架构,采用原生多模态设计理念。该架构的核心创新在于将文本理解、图像生成、编辑处理等功能统一在一个模型中,而不是传统的多模型组合方案。

架构优势

  • 统一处理:避免了多模型之间的信息损失和不一致性
  • 上下文理解:32K上下文窗口,支持复杂的多轮对话和编辑
  • 知识集成:内置丰富的世界知识,包括物理规律、历史文化、地理信息等
  • 实时优化:模型能够根据用户反馈实时调整生成策略

核心技术能力深度解析

1. 文本到图像生成技术

该技术不仅支持基础的文本描述转图像,更具备了深度的语义理解能力。例如:

  • 物理规律理解:输入”这个披萨在400度烤箱里烤2小时”,模型会生成烤焦碳化的黑色披萨,而不是普通烤披萨
  • 时间概念理解:询问”这个冰淇淋在太阳下放5分钟会怎样?”,会生成部分融化的冰淇淋图像
  • 逻辑推理:能够理解因果关系,生成符合逻辑的图像内容

2. 智能图像编辑引擎

编辑引擎的核心优势在于”精准控制”,用户可以像使用美图秀秀一样简单操作,但获得专业级的编辑效果:

精准局部编辑

  • 面部美化:去痘痘、画妆容、调整表情
  • 体型调整:瘦身、增肌、改变身材比例
  • 细节保持:纹身、痣、疤痕等个人特征完美保留
  • 服装替换:换装时保持人物身份和姿势不变

环境适应性编辑

  • 背景替换时自动调整光照匹配
  • 添加物体时考虑透视和阴影关系
  • 删除元素后智能填补背景内容

3. 角色一致性保持算法

这是 Nano Banana 最为突出的技术优势,解决了 AI 图像生成领域的核心难题:

4. 多图融合与风格迁移技术多图参考合成

  • 支持同时上传多张参考图片
  • 能够理解图片之间的关系和用户意图
  • 智能提取不同图片的优势元素进行合成

风格迁移能力

  • 艺术风格转换(如梵高、毕加索风格)
  • 时代风格转换(50-90年代复古风格)
  • 材质风格转换(3D手办、乐高积木、毛绒玩具等)

5. 物理规律理解与推理能力

这是 Nano Banana 相比其他模型的独特优势,体现了真正的”智能”:

时间流逝理解

  • 能够预测物体在特定时间后的状态变化
  • 理解老化、腐蚀、成长等自然过程
  • 支持“10年后会是什么样”的时间推演

物理现象模拟

  • 重力效应(物体掉落、液体流动)
  • 温度影响(融化、燃烧、结冰)
  • 光照变化(阴影、反射、折射)

空间关系理解

  • 透视关系处理
  • 物体遮挡关系
  • 相对位置保持

3. 主要功能特性

核心技术能力

自然语言编辑

  • 通过简单的文字描述实现复杂的图像编辑
  • 支持中文和英文指令,理解上下文语义
  • 一次指令可以同时处理多个编辑要求

角色一致性保持

  • 99%面部特征保留率,解决AI图像生成最大痛点
  • 多角度、多场景下保持人物身份特征不变
  • 支持批量处理时的一致性维护

物理规律理解

  • 理解时间、温度、重力等物理现象
  • 能够推理物体在特定条件下的状态变化
  • 生成符合逻辑和常识的图像内容

多模态融合

  • 同时理解文本指令和图像内容
  • 支持多张图片的参考和融合
  • 32K上下文窗口,支持复杂的多轮对话

独特优势特性

精准局部控制

  • 只修改指定区域,其他部分完全保持不变
  • 细节级别的编辑精度(如只去痘痘,保持皮肤纹理)
  • 智能边界处理,编辑结果自然无痕

智能环境适应

  • 自动调整光照、阴影以匹配编辑内容
  • 保持透视关系和空间逻辑
  • 新增元素与原有场景和谐统一

世界知识应用

  • 内置地理、历史、科学等领域知识
  • 能够生成专业领域的准确内容
  • 支持教育科普类应用的知识可视化

4. 市场典型应用案例详解

4.1 个人美化与创意应用

案例1: 美图秀秀替代应用 – 个人美化革命

背景介绍

随着社交媒体的普及,个人照片美化需求日益增长。传统的美图软件往往存在过度处理、不自然等问题,而Nano Banana的出现彻底改变了这一局面。

具体操作流程

基础美化

  1. 上传原始照片
  2. 输入指令:“让这个女生瘦一点,大概100斤”
  3. 等待生成结果

进阶美化

  1. 继续输入:“换一下看起来,被太阳晒过”
  2. 如果晒的太过分了再次输入:“有一点晒痕即可”

技术亮点

  • 精准控制:每个指令都能精确执行,不会影响其他部分
  • 细节保持:瘦身效果匀称自然,面部特征99%保持不变
  • 个性保留:连纹身、痣等个人标识都完美保留
  • 自然效果:处理后的图片看不出明显的P图痕迹

案例2: 时代穿越写真 – 复古风潮的AI化

项目背景

复古风格写真在年轻人中极为流行,但传统的复古写真需要准备大量服装、道具和场景,成本高昂且效果有限。Google AI Studio推出的时代穿越写真应用一经上线就引起轰动。

技术实现

  • 一键生成:上传一张个人照片,AI自动生成5个不同年代的造型
  • 历史准确性:50、60、70、80、90年代服装、发型、完全符合历史特征

未来创新商业模式创新

  • 影楼转型:传统影楼开始提供”AI时代穿越写真”服务
  • 个性化定制:可以根据客户需求调整特定年代的风格细节

技术优势分析

  • 历史知识库:AI内置丰富的历史文化知识,确保风格准确性
  • 人物一致性:不同年代风格下,人物的基本特征保持一致
  • 细节处理:连时代特有的摄影技术效果都能模拟(如老照片的颗粒感)

案例3: 电商换装系统

行业痛点 :

传统电商服装展示面临多重挑战:模特成本高、拍摄周期长、库存风险大、个性化展示难。一套服装需要多个模特、多个场景的拍摄,成本动辄数万元。

技术实现流程

  1. 上传图片:上传本人图片
  2. 智能换装:通过简单指令让模特试穿不同服装

具体操作案例 :

  • 基础指令:“让这个模特穿上黑色西装”
  • 变化指令:“换成红色西装”
  • 风格指令:“换成休闲的花T恤”
  • 场景指令:“在办公室场景中展示”

4.2 电商与营销应用

案例4: 品牌营销素材制作 – 创意产业的效率革命

AI解决方案实施

  • 产品图优化:将产品放置在不同场景中(办公室、咖啡厅、海边等)
  • 模特搭配:让不同风格的模特使用产品
  • 光效调整:根据不同时间和场景调整光照效果
  • KOL合作:生成与知名博主合作的概念图

创新营销玩法

  • 用户定制:让消费者上传自己的照片,AI生成个人专属的产品使用效果
  • 虚拟试妆:通过AI展示不同妆容效果,提升购买转化率
  • 场景营销:根据用户的生活场景推荐相应的产品搭配

4.3 创意设计突破性应用

案例5: 3D手办制作革命 – 从概念到产品的跨越

技术突破案例 – 黑神话悟空手办

创作过程:

  1. 素材收集:上传2d图片
  2. AI处理:上传截图,输入”制作成桌面3D风格”
  3. 细节优化:通过追加指令调整姿势、表情、配件等细节

未来新兴商业模式:

  • 预售验证:先用AI生成效果图,根据市场反应决定是否生产
  • 个人定制:用户上传照片,定制个人专属手办
  • IP授权:游戏公司直接提供素材,快速推出官方手办
  • 众筹模式:基于AI效果图进行众筹,降低投资风险

技术应用拓展

  • 游戏周边:所有游戏角色都可以快速手办化
  • 动漫衍生:动漫角色的周边产品设计
  • 个人纪念:宠物、家人的纪念手办制作
  • 企业定制:企业吉祥物、品牌形象的立体化

案例6: 名人合影创意 – 社交媒体的新玩法

现象分析

“与明星同框”等创意内容在社交媒体上病毒式传播,这种玩法不仅满足了用户的娱乐需求,也展示了AI技术的强大能力。

技术实现原理

  1. 多图理解:同时分析用户照片和目标人物照片
  2. 场景构建:根据合影需求构建合适的背景场景
  3. 自然融合:调整光照、角度、比例,使合影效果自然
  4. 细节优化:处理阴影、反射等细节,增强真实感

应用场景扩展

  • 旅游纪念:与历史名人在著名景点”合影”
  • 粉丝文化:与偶像的”亲密互动”照片
  • 教育应用:与历史人物”对话”的教学素材
  • 营销创意:品牌与名人的”合作”宣传图

案例7: 个性化产品定制

用户体验流程:

  1. 照片上传:用户上传个人照片或宠物照片
  2. 风格选择:选择喜欢的艺术风格(手绘、油画、卡通等)
  3. 个性化调整:用户可以要求微调颜色、布局等细节
  4. 下单生产:确认设计后直接进入生产流程

产品品类扩展

  • 服饰类:T恤、帽子、包包的个性化图案设计
  • 家居类:马克杯、抱枕、装饰画的定制设计
  • 数码类:手机壳、笔记本贴纸、充电宝外观设计
  • 礼品类:生日礼品、纪念品的个性化定制

4.4 专业领域应用

案例8: 家装设计可视化 – 装修行业的数字化转型

技术实现流程

第一步:基础改造

  • 上传毛坯房照片
  • 输入:“先刷白色墙壁”
  • 实时查看墙面改造效果

第二步:家具添置

  • 继续输入:“添加现代风格的灰色沙发”
  • 再输入:“放置一个白色书柜”
  • 最后:“添加绿植装饰”

创新服务模式

  • 免费设计:基础AI设计免费提供,吸引客户
  • 个性化定制:根据客户生活习惯定制专属方案
  • 实时调整:客户现场看房时实时调整设计方案
  • 成本透明:每个设计元素都有明确的价格标注

行业示范效应

  • 传统装修公司开始转型升级
  • 家具厂商开始提供3D产品模型库
  • 房地产开发商将此技术用于样板间展示
  • 装修设计师的工作重点从画图转向创意和服务

总结

Nano Banana(Gemini 2.5 Flash Image)作为Google推出的革命性AI图像生成与编辑工具,正在重新定义数字创意产业的边界。通过本指南的深入分析,我们可以看到这款工具的核心价值体现在以下几个方面:

技术突破的里程碑意义

Nano Banana最大的技术突破在于解决了AI图像生成领域长期存在的角色一致性问题。99%的面部特征保留率不仅仅是一个数字,它代表着AI技术从”能用”到”好用”的质的飞跃。。

应用场景的广泛覆盖

从个人美化到专业设计,从电商营销到教育科普,Nano Banana展现出了惊人的适应性。特别值得关注的是:

  • 个人创作领域:美图功能和时代穿越写真让普通用户也能创作出专业级作品
  • 商业应用领域:电商换装和营销素材制作大幅降低了企业的运营成本
  • 创意设计领域:3D手办制作和名人合影等创新玩法开拓了全新的商业模式
  • 专业服务领域:家装设计和教育科普展示了AI技术在传统行业中的变革潜力

商业价值的深度释放

通过多个真实案例的分析,我们看到Nano Banana不仅是一个技术工具,更是一个商业价值的放大器:

  • 成本优化:传统设计服务成本降低90%,为中小企业提供了平等的创意机会
  • 效率提升:从2周的制作周期可能会缩短到2天,让创意响应速度提升700%
  • 门槛降低:自然语言编辑让非专业用户也能创作出专业级内容
  • 模式创新:催生了AI影响者、个性化定制等全新的商业模式

行业变革的深远影响

Nano Banana的出现不仅仅是技术的进步,更是整个创意产业生态的重构:

  • 传统行业转型:影楼、装修、教育等行业开始拥抱AI技术
  • 新兴职业涌现:AI提示词工程师、虚拟内容创作者等新职业出现
  • 商业模式升级:从人工密集型向技术驱动型转变
  • 创作民主化:让更多人拥有了专业级的创作能力

未来发展的无限可能

作为AI图像生成技术的重要里程碑,Nano Banana预示着:

  • 技术发展趋势:AI将在更多专业领域实现突破
  • 应用场景拓展:从2D图像向3D建模、视频生成等方向延伸
  • 商业生态完善:围绕AI创作工具将形成完整的产业链
  • 社会影响深化:AI创作将成为数字时代的基础技能

相关链接资源

官方平台与工具

  • LMArena:lmarena.ai-免费体验平台,支持模型对比
  • GoogleAIStudio:aistudio.google.com-官方开发平台
  • OpenRouter:openrouter.ai-多模型集成平台

作者:馒有理

]]>
Lovart + Nano Banana这几招一般人不会告诉你,但我会! //m.clubpenjuin.com/377538.html Thu, 18 Dec 2025 01:44:32 +0000 //m.clubpenjuin.com/?p=377538

 

上次写完 Nano Banana 和 Lovart 的趣味结合,当时我说还有一些脑洞等有时间再为大家补充,好好好现在趁着会员还热乎赶紧把新的想法实践了一下给大家端上来。

我们在原生对话框中探索 Nano Banana 的可能性,但要产出套图、批量化、体系化的内容,像 Lovart这样的 Agent 会撑起更丝滑的工作流。比如今天我要尝试的这些玩法,更多玩法已上新,就是现在,和我一起来试试!

上链接:https://www.lovart.ai/

下列图片均为AI生成,文中提示词内容有AI参与优化,文章内容为阿真纯手搓,图片细节有问题都怪 Nano Banana,如果文章内容有错别字以及废话多的情况都怪阿真,谢谢大家理解哎嘿。

目录

1. 稳定二创输出

2. 多角色漫画

3. 英语学习课件

4. 制作学习讲座

5. 图片分镜视频一条龙

6. 模拟竞生游戏

7. 小结

1. 稳定二创输出

比如想给我们芙利莲尝试多个招式场景的效果。

图1是原图,后面是 Lovart 给我的结果。

提示词:使用Nano Banana模型,为角色创作动态分镜序列,展现各种电影化视角、表情和魔法瞬间,保持角色设定和形象不变。

NB模型有一点就是图像不够清晰,图片还需要二次放大。

Lovart:小问题,一条龙服务,包到位的。

下方是对比效果(笑死,对比效果Lovart自己做了,不要太贴心):

最简单的二创就从这里开始了。

基于 Nano Banana 强大的能力,一个角色可以稳定,多个也可以稳定,那么做别的也可以啊。比如多角色漫画,可以试试!

2. 多角色漫画

比如我想让芙利莲带着2个不知名的我AI生成的小角色露芙和蘑菇头开启一场探险游戏。

选中画布中我们的3张图片,Tab 一下,然后输入提示词:

提示词:

使用NanoBanana模型,根据3个主角进行多页单独的漫画分镜创作:每页1-2个镜头,完整迷你故事情节,丰富的表情动作变化,彩色漫画风格,包含对话框、心理独白、音效文字。

我这里提示词没有写过多情节,所以看起来故事不够清晰完整,大家可以在提示词中加入详细的故事情节。

等一会儿会看到输出图片:

这里出了个问题就是因为Nano Banana总是参考原图比例,因为我这里有图片比例没有修改,所以出来了方形的图。

新的痛点有了,上传的图片比例和想要输出的图片比例不一致,每次调整比例很麻烦?

我有一妙计,免费且方便。

如果需要在修改图片的同时,扩展图片画面,那么可以这样:

修改比例后输出漫画效果(篇幅问题,这里放一小部分):

提示词「AI优化」:

使用NanoBanana模型,根据3个主角进行10页单独的漫画分镜创作:每页1-2个镜头,完整迷你故事情节,丰富的表情动作变化,彩色漫画风格,包含对话框、心理独白、音效文字。

在被迷雾笼罩的远古森林里,银发精灵法师、淘气的蓝发小精灵和呆萌的蘑菇小子组成探险小队,他们一路破解会唱歌的荆棘迷宫、智斗巨石守卫、闯入影子怪物盘踞的古塔,最终找到了传说中的黎明之石。

但是,这时候大家要说了,纯英文的怎么办啊!

我又有两招。利用英文,或者做空对话框。哈哈快来继续学。

3. 英语学习课件

继续,我有3个角色,甚至这里可以用自己的真实照片做参考。用自己或者小朋友的照片生成学习漫画也不错。

比如生成连续性漫画故事,一致性妥妥的,还包带加入四级生词的。故事内容也挺有趣的哈哈。

生词我要求它标红也可以。可能文字多了会有细微的错误,但是很容易就可以修改。

提示词「AI优化」:

使用NanoBanana模型,绘制一部8页的彩色漫画,主角为上传的三位角色(猫、小女孩、小男孩),保持人物形象一致。

漫画要有连贯的故事情节,8页连在一起构成一个完整的冒险故事。

对话要求:

1. 每一页都要有英语对话气泡。

2. 对话中出现英语四级词汇时,请用红色标注(highlight)。

3. 气泡位置要合理,清晰易读。

画面要求:

1. 每一页都要是彩色漫画,风格明亮清晰,适合儿童读物和语言学习。

2. 背景要多样化(室内、校园、街道、森林等),避免单一场景。

3. 分镜景别要有变化(远景、中景、近景、特写等)。

4. 强调角色的情绪变化,增加故事性和趣味性。

想加入中文英标例句等,还可以看看参考之前那篇,将两者结合起来。

4. 制作空对话框

如果我们不想要英文内容,那么做成空对话框也可以。参考我这个:

提示词「AI优化」:

绘制一组10张连贯的三格或四格漫画,每张漫画都包含3-4个分镜,总共形成一个完整的故事。

主角为参考图片中的角色,始终保持形象一致。

每一格都有空白的对话气泡,请保持气泡中没有任何文字。

要求:

故事要有连续性,10张漫画连贯起来构成一个完整的剧情发展。

每张漫画的4个分镜景别要有多次变化。

背景场景需要在不同漫画中切换。

保持整体风格统一,可爱、卡通、清晰的漫画风格。

角色表情和动作要丰富,强调故事感和情绪变化。

敲黑板!!

两个知识点,一是要记得首先参考图比例要改成我们想要的比例,这样输出的比例才是我们想要的比例,这点非常重要。二是遇到有的多个漫画白色边框比较少的,还是可以用我前面的方法,加个底框,合并,这样就有白框了。操作方法如下:

直接自己添加文字也可以。

和之前一样,记得做好了之后,合并背景和文字层再导出。

5. 图片分镜视频一条龙

基于 Nano Banana 的一致性和 Lovart 的批量功能与智能多协作,我们现在制作更精良和一致的视频也变得更加轻松了。

开局一张图,开局我只有下面这张图:

我把这张图给Lovart,然后使出「秘技 · 提示词」,就得到下面的:

提示词:

使用Nano Banana模型,参考所给图片的角色与风格,生成 8 格连续分镜(起承转合),保持角色关键识别点一致;每格使用不同镜头语言与构图(大全景、近景、特写、俯拍、仰拍、运动镜头),呈现丰富表情与动作。

一致性与连贯性非常感人。

数量自己修改,提示词非常通用,改改分镜数量就可以了。

再让它生成视频,然后剪辑工具启动一下拼接加音乐:

提示词:

使用HaiLuo-02模型生成一段无缝衔接的视频,过渡自然,动作流畅,光线与环境保持统一,从开始到结束呈现丝滑连贯的效果。

6. 模拟宠生游戏

还有个脑洞,还是基于@赛博禅心 大聪明老师的长图和模拟人生的发散,做了个模拟宠生的小提示。

基于我们上传一张宠物的图,会无限延伸宠物超进化的形态(逐渐抽象哈哈哈):

看清澈的小猫咪逐渐进化成终级形态哈哈哈,下面是原图:

它会先输出过程图:

然后给我们长图,看看猫主子的《喵星修仙传》:

还可以有更多离谱的,欢迎各位铲屎官多多尝试。

提示词如下(基于个人创意,AI加强发散优化):

【插图生成部分 – 使用Nano Banana模型】
基于用户上传的宠物照片,生成6张进化阶段插图,要求:
-参考原图:只需保留1-2个最显眼的特征(如眼睛颜色、主要毛色或独特斑纹),其他部分可以大胆改变
-进化设定:幼体形态→少年形态→成年形态→元素觉醒→传说形态→究极神话形态-变化幅度:每个阶段都有显著变化,体型、外观、能力特征大胆创新,只要保持微妙的相似感即可
-视觉风格:卡通矢量描边风格,扁平化设计,粗线条轮廓,单色纯净背景
-创意自由:可以添加翅膀、触手、机械部件、元素光效、神话特征等夸张元素
-英文标注:每张图片包含对应的英文标签(Baby / Teen / Adult / Mystic / Legend / Ultimate)
-图片规格:适合网页嵌入的高清格式【HTML长图网页生成部分】创建一个竖向长图网页,
技术要求:
-页面尺寸:宽度1080px,自适应高度,移动端友好
-整体布局:干净简洁,充足留白,舒适阅读体验
-字体设置:主要文字38px,标题更大,确保移动端清晰可读
-结构组成:
1. 顶部标题区:抽象搞笑中文主标题如”[宠物名]修仙日记:从土狗到宇宙霸主的沙雕进阶路”
2. 插图嵌入区:依次插入6张Nano Banana生成的进化插图
3. 配文说明:每张插图下方2-3行超级搞笑抽象的中文解说,用梗用谐音用沙雕语言,重点词汇加粗突出
– 示例风格:**第3阶段:社会你狗哥**
——
开始戴金链子抽华子,眼神透露出”你瞅啥”的霸气
-**第5阶段:赛博朋克宠**
—— 身体70%已被机械改造,但还是会因为看到骨头而尾巴摇成螺旋桨
4. 底部总结:超级抽象搞笑的收尾段落,如”从憨憨萌宠到维度破坏者,这就是爱情的力量吗?”
-语言风格:大量使用网络梗、谐音梗、沙雕表达、抽象比喻,让人忍俊不禁
-视觉效果:温馨明亮配色,插图与沙雕文字搭配和谐,支持截图分享-交互优化:适配手机屏幕,滑动流畅,加载快速
最终输出:一个包含6张大胆进化插图和爆笑抽象文案的完整HTML长图网页,展现专属宠物的离谱变化历程。
Sep 5, 2025

小结

笑死,创意太多了,根本写不完,充了年费会员,以后有机会还能写,今天就先到这里了🤣

我是 Lovart 深度用户了,个人非常喜欢这种有图片视频拖进一个画布的方式,查找和调用非常方便,选择图片,涂鸦标注,直观输出这种也是很强大,还有选择多张图片,Tab一下输入提示词是最好玩的,非常丝滑。

在Nano Banana 的加持下,Lovart 向着更高效的生产力工具迈进了一大步。

越来越好玩了,如果今天的内容对大家有帮助,欢迎大家给阿真猛猛三连鼓励!98加满~!

朋友们尝试过的有趣的案例、突然萌生的新想法,也欢迎在评论区讨论!

作者:阿真Irene

来源:阿真Irene

]]>
谷歌Nano Banana Pro新出20种邪修玩法 //m.clubpenjuin.com/376751.html Mon, 24 Nov 2025 01:36:24 +0000 //m.clubpenjuin.com/?p=376751

 

来不及解释了,全世界都知道Nano banana这个称霸生图的香蕉上线了新pro版本!

还是和我们第一时间接入新模型的lovart一拍即合,我带着百镜系列卷土重来,测测测测测了一整晚,照例是带提示语和效果展示,还有详细的使用教程。

我敢说,这个case数量绝对是数一数二,也能让你迅速了解pro版本的香蕉现在有多强!

话不多说,Here we go!

首先来看文生图方面,Nano banana pro版本最突出的进步就是,拥有了非常稳定的中文能力,这个不仅体现在能做大字海报上,而是大字小字超多文字都可以。

直接来个超强的case。

在画面上方有一张长长的画卷上用潇洒的书法写着一整首白居易的《琵琶行》内容是“浔阳江头夜送客,枫叶荻花秋瑟瑟【这里写好琵琶行全文】座中泣下谁最多?江州司马青衫湿。“,同时下方用中国水墨画风格画上这首诗对应的画面

谁懂我看到这张图时的震撼,甚至这个效果只用了一遍就做出来了,不论是文字的稳定性还是下方水墨画的展现都太牛了,这怎么一个版本更新直接就吊打所有人了。

中文能力的提升带来的就是还可以让banana直接复刻一个聊天记录,

生成一张微信手机聊天界面截图,严格按照微信的界面UI和排版方式,左侧对话气泡是灰色,右侧对话气泡是绿色,右侧是甄嬛的角色在讲话

群聊名称:紫禁城吃瓜群

聊天内容:

1.(头像:华妃经典剧照翻白眼表情包) 年世兰:本宫刚听说皇上新得了个会唱昆曲的鹦鹉?@安陵容 妹妹,是你教的吧?

2.(头像:流泪猫猫头) 安陵容:姐姐说笑了…嫔妾只会唱曲儿,教鸟儿说话,还得是⬛苏公公…

3.(头像:甄嬛端庄剧照) 甄嬛:陵容妹妹的嗓子,连黄鹂都自愧不如。倒是那鹦鹉,学舌的本事,怕不是跟某些人学的?

4.(头像:皇后端庄微笑但眼神犀利的表情包) 皇后:好了好了,姐妹和睦要紧。@华妃 妹妹,你宫里的蟹粉酥不错,本宫让剪秋去取些?

5.(头像:华妃经典剧照翻白眼表情包) 年世兰:呵,皇后娘娘想吃?可惜啊,刚被颂芝“不小心”全打翻了!‍♀️(配图:一碟点心扣地上的表情包)

6.(头像:叶澜依抱猫剧照) 叶澜依:…无聊。有这功夫不如去喂我的大猫。

7.(头像:敬妃数砖表情包) 敬妃:@叶澜依 妹妹的猫…今天又挠坏了我宫里三块金砖! 这个月第三回了!

这以后防诈又要多加一个心眼子了。

而且,Google你这次训练到底用了多少数据啊!啥图都能做,

生成一张原神的实机战斗图片,旅行者主角正在和 boss 埃隆·马斯克战斗,马斯克站在一台悬浮的火箭装甲上发射能量炮,画面为3D高饱和度奇幻原神游戏风格。

所以,在Nano banana的世界里,原神中是能跟马斯克干架的。

还没完,那再看看这个全家福大乱炖。。。。

中国动画中的孙悟空和路飞、漩涡鸣人、炭治郎、御坂美琴、蕾姆、桐谷和人、明日香、草帽乔巴、鹿目圆、阿尼亚·福杰、黑崎一护、艾伦·耶格尔、灰原哀和初音未来和哪吒、李白、唐僧、海绵宝宝、蜡笔小新、迪士尼公主们站在一起,大杂烩式同框,集体大合照;背景是一望无际的草原、蓝天与白云,整体明亮清新的动漫风格。

这真的是一张我靠写写名字就能得到的图吗,童年记忆都能同框了啊。

这以后做什么同人漫画,周边,吧唧也就是一句话的事。还有还有,延续之前的优势,Nano banana依旧具备很强的世界知识,比如让它做科普图,

用中文给我制作一张科普图片,讲述详细的植物进行光合作用的原理

设计「经典光学实验:牛顿三棱镜分光」分镜式科普海报:左侧画入射白光,中间为玻璃三棱镜,右侧准确依波长顺序散出七色光带;下方小框再现“光的色散”公式 n = c/v;整体为 4:3 比例高清矢量,背景深灰,文字用无衬线体。

用中文绘一张「人类基因组 23 对染色体概览」信息图:按实际长度比例竖排染色体条,使用不同渐变色区分常染色体与性染色体,侧边列出每对染色体与已知疾病/特征相关的代表基因(如 HBB、BRCA1);

有没有人管管Banana Pro啊,连化学方程式都给我配平了喂,还有就是有没有学医的人看看这张关于染色体的图是不是正确啊,外行人看已经是可以放进教科书的程度,真把我给唬住了。甚至是直接通过文字做出非常逼真并且细节面面俱到的UI界面,

或者是只是通过文字就能做出这种审美高级又能展现城市特点的海报。

我平时测到凌晨三点的时候已经开始困了,但心里一直有个声音不断在说“还能这样?这样也行?我去,还可以这样?”

直到我做出下面这张图时,我感觉我的大脑褶皱完全展开了(熬夜的后遗症这就是,大家不要熬夜测case)

拿放大镜看的话细节处还是有些问题的,但是从整张图的完整程度来看,已经是目前生图领域的又一个天花板了。

OK,文生图测试到这,给图生图留点位置,毕竟我们实际应用中,用到最多的就是图生图,对一致性的需求非常高。

我决定放出我的模特小猫!

帮我的猫穿上疯狂动物城的兔子警官 cos装扮,包括头套帽子和衣服,衣服合理的套在小猫身上,去掉小猫前方的遮挡物,保持原图的构图和写实风格

说实话,第二张生成的图我一晚上骗到了很多人,就是我这猫的铲屎官一下子也没反应过来,感觉这小衣服套我家猫身上就应该是这样啊!

那在这个基础上,我还可以给我的小猫做一张和肯德基的联名海报,甚至我都不需要写海报的文字,Banana Pro自己自由发挥的效果都很好。

以「77(猫的名字)X肯德基」联名企划为主题,围绕同一只宠物(形象、花色等与上传图片绝对一致)生成一张联名海报。统一宠物形象与肯德基品牌识别(红白配色、经典LOGO、餐厅场景等)的前提下,让小猫穿肯德基员工制服、带上肯德基员工帽子,佩戴工牌站在柜台前、兜售炸鸡、汉堡和套餐、与炸鸡桶、薯条、汽水等元素互动等。画面风格活泼、有趣、具有商业联名感,适合用于线上宣传与活动海报。然后自由的为这张海报添加合适的中文内容。

还可以利用lovart内置agent对话的优势,直接调用banana生成一组海报图,这个批量生图的速度和质量我真的原地跳起来720度点赞。

Banana pro这次还有升级,对于风格的迁移能力加强了,比如我想复刻一张海报,现在真的就是打几个字就可以,它都是可以自动给你改好内容的。。。。

参考图片风格,将主题色换成粉色,将菜篮子换成化妆箱,并将图中关于生鲜水果的元素和文字全部改成美妆的元素和文字内容

字体的迁移能力也很强,基本上处处保持一致,还有自己的小细节,包括下面这张马年海报,甚至图中巨小的英文都从“SNAKE”改成“HOUSE”,几乎和背景色融为一体极易被忽略的“2025”也改成了“2026”。

参考图片的风格和色彩以及构图,生成一张2026年马年大吉的春节海报,保持字体一致

如果有一个具体的产品,同时还想复刻想要的海报风格,上传两张图就完事了,照样可以得到一张背景、细节元素、文字都和你的产品一一对应的海报,同时产品还能保持高度的一致。

参考图1的海报风格,制作一张图2洗衣液产品的海报,保持图2的产品一致性,同时图中所有的元素和文字内容都是和图2的洗衣液相关

中文能力强,风格迁移能力强的Nano banana pro还还还还保持了丰富的世界知识,还能生成4k的具备更高细节的图片,比方我可以让它建模一张城市线稿,

根据这张线稿,生成一张细节丰富的城市设计效果图

或者是让它转换拍摄视角,

把这张图的四格场景都换成头顶的俯视视角

甚至能在保证原图一致的情况下,既完成填色还能完成翻译,完了,这下汉化组也可以下班了。。。。✏

给这张漫画页上色并翻译成中文放到图中原来的位置,保持构图和图片细节的一致

还有一个真的牛到超出我想象的能力,我给Banana这样一张书的内页,让它帮我生成下一张书页的内容。

于是就有了这张我堪称为神级效果的图,真的延续了上一页的文字内容,甚至还做出了合适的配图,而且打印在书上的文字,就是很清晰的宋体,你跟我说这是AI?

生成图中这本书的下一页,页面的位置要正确,文字内容要延续,并且文字保持清晰

到这里,我不相信你还不想去试试。。。。

这把老朋友还是有送福利!

11.21到11.23 Lovart里的 Banana Pro 全员FREE。到11.30前订阅Basic以上任意的年plan,送Banana Pro「365 天 Unlimited」,生图模式下0积分不限量使用

距离上一版的Nano banana才过去不到三个月啊,我甚至有种错觉这模型已经上了一年了,那么短的时间,AI生图上限又被打破了,前天我还在讲Gemini3是又一个GPT时刻,今天的Banana pro又是生图界的GPT时刻。

解决了原本中文小字难以维持稳定的情况,还拥有着极强的世界知识和推理能力,甚至还有几乎一遍成的成功率。

我相信,不管是设计界,影视界,跨界的,在见到它的时候一定又惊又喜,但是,怕什么呢?

这个时代就是如此!

作者:阿汤,卡尔

来源:卡尔的AI沃茨

]]>
谷歌Nano Banana Pro的N种邪修玩法,拿去! //m.clubpenjuin.com/376734.html Fri, 21 Nov 2025 06:50:55 +0000 //m.clubpenjuin.com/?p=376734

 

我知道,你可能还在Gemini 3的“炸裂”中惊魂未定。

但现在,请系好安全带,因为Nano Banana Pro(也就是大家口中的NB 2)来了。

官方说,Nano Banana Pro是专门为解决最具挑战性的图像生成任务而生,基于Gemini 3 Pro模型训练,带来了更强的推理能力、世界知识、实时信息生成能力、多轮图像生成能力,以及新的图片编辑功能(可改变相机角度、场景光线、景深、对焦等)。

省流:NB 2=Double 牛逼。

在前端死了第8回的次日夜晚,设计师又阵亡了第13次。

当前状态:卧槽?寄!

一手实测:既是测试,也是玩法分享。

测试平台,还是我们的老朋友:Lovart(不要魔法)。

访问lovart.ai,关掉自动,勾选模型Nano Banana Pro。

可以免费体验Nano Banana Pro,三天。如果订阅Basic及以上会员,则送365天Nano Banana Pro无限量使用。

Lovart有个好处是,它有独家的画布编辑功能+其他模型配合(比如视频、3D、音频等)

那接下来,我们这就开整。

1)中文海报

第一个,我想测的就是中文能力。我们知道,上一版其实并不支持中文,我想知道这一版的中文能力到底怎么样了。

用上我的祖传提示词。

一张专业、高品质的PPT封面设计,文字:
{
纳米香蕉
谷歌就是牛逼
}
画面现代且优雅,布局简洁,层次分明。
具有3D空间感、细腻的渐变、柔和的光影效果和电影级氛围。
整体画面风格应自然贴合内容主题(如果是科技 → 融合未来感UI元素;如果是商业 → 抽象的企业几何造型;如果是自然 → 有机纹理与山水氛围;如果是艺术/人文 → 高级配色与典雅图案)。
大厂级审美,精致、简洁,高级感强,视觉冲击力突出但不杂乱。
尺寸16:9。

这效果可以啊。再来一个,竖版的海报。

大师级排版海报设计,画面展现一片广阔的荒原,一条笔直的公路延伸向远方,尽头是一轮巨大的橙黄色落日,天空和荒原被落日染成暖橙与金黄的色调,整体氛围辽阔且充满希望,对称构图,一辆吉普车穿行在公路上,宏大场景。
画面底部有白色潇洒灵动手写风格的文字“即刻启程 奔赴山海”,部分笔画连笔,粗细变化丰富,字迹错落分布。画面中还有黄色小字英文装饰“begin”,3:4比例。(提示词参考@轩轩)

卧槽,追上即梦了啊。

继续上难度,考考它对连续生图的支持情况,这刚好也是Lovart这个Design Agent的优势。

创作4张分别是春分、夏至、秋分、冬至的“四时更替”海报,白色背景,每张对应相应的季节色彩,整体风格保持一致,画面效果和排版方式一致。

看到这里,我知道你可能想说:这有什么了不起的,这不即梦也可以做嘛。

在一边测的过程中,我就一边在想,既然Nano Banana Pro是基于Gemini 3 Pro训练,那么他的推理能力、世界知识应该很强吧。

于是,Prompt就有了。

生成重庆的旅游指南,手账形式,纯中文。

生成一张可视化的图片,展示我在武汉旅游的2天行程。

参照词典,生成“耄耋”的词语解释。

参考中国语文课本,为古诗《黄鹤楼》生成一页课文,诗、拼音、注释一应俱全。

为什么外国人做了一个这么懂中文的模型?而且,这些提示词都是超级简单。

卧槽,我还能说什么?

2)GUI二创

GUI(Graphical User Interface),是指图形用户界面,比如我们在电脑、手机里看到的各种界面,这些通通都属于GUI。

没记错,Gemini 3 Pro在GUI识别这块,是碾压级的存在。

就是这个ScreenSpot-Pro榜单,专门用来测试模型的GUI识别能力,Gemini 3 Pro成绩72.7%,Claude 4.5是36.2%,而GPT-5.1只有3.5%。

所以,我们上提示词。

生成一张Windows XP的桌面截图。要求包含:经典草原背景、左下角“开始”按钮、一个打开着“我的电脑”窗口,窗口内文件列表的字体和图标必须还原Windows XP风格。(提示词参考@AIGC新知)

生成一张Windows 11的桌面截图。同时打开着三个窗口:一个半透明的“设置”窗口、一个Google Chrome浏览器窗口和一个“我的电脑”窗口。要求窗口阴影和层级关系正确,窗口标题栏中的中文准确。

其实,仔细看,在一些中文字生成上,还是有“鬼画符”。但上一版是完全不会中文,谷歌不到3个月就提升这么大,是真的强。

生成一张最新macOS的桌面截图。要求:顶部菜单栏清晰显示WiFi、时间(0:23 AM)和电池图标,桌面上正打开一个Chrome浏览器,里面是马斯克推特的主页。

英文这块,就完全没问题了,无论字多字少,基本没有“鬼画符”。

参考这张图,生成一张类似风格的UI,主色调改为橙色。

OpenAI说:我黄(慌)了……

测到这,我能想到,嗯,那个……也真的太容易了吧?

卧槽,千万别用Nano Banana Pro去作恶啊!千万别做!千万别作!!

3)动漫分镜图

这个Prompt参考自@阿真,主题和主角可以自由修改。

生成像《灌篮高手》那种专业分镜结构、漫画叙事节奏、对白气泡、拟声词、画格布局、视角变化、动态镜头,但主角换成 詹姆斯 和 库里 在NBA总决赛喷垃圾话的故事,中文对白。

詹库对决,这话题度拉满。

就是,这左下角怎么有个bilibili?看来,谷歌没少拿国内数据做训练啊。

4)游戏界面

游戏界面对UI的要求非常高,这也是设计师从业最多的行业之一。

我们看看Nano Banana Pro对人物、特效和游戏数值的精准控制情况。

生成一个《黑神话:悟空》的游戏界面,天命人身着全套大圣套装,正在与二郎神激战。

生成一个《英雄联盟》的游戏界面,多名英雄正在水晶团战,水晶就差一刀被秒掉。

生成一个《剑网3》战斗界面截图。要求:屏幕左上角显示玩家和目标气血/内力条(显示中文数值,如:气血 95%);屏幕下方显示技能快捷栏,其中三个技能处于中文冷却倒计时状态(如:‘冷却:12s’);右下角显示聊天窗口,内容为中文游戏对话。(Prompt by AIGC新知)

5)小红书封面

我个人预判,小红书的封面和配图,可能会是Nano Banana Pro最先落地的场景。

因为,以后生成小红书封面,真的只要一句话。

生成通勤OOTD穿搭主题的小红书笔记封面,尺寸3:4,内容:“打工人一周穿搭不重样💼5套显瘦又高级的通勤look,懒人直接抄作业!”

生成租房改造vlog主题的小红书笔记封面,尺寸3:4,内容:“500元爆改出租屋🏠从老破小到奶油风小家,房东都问我是不是换了房子!”

生成学生党平价彩妆主题的小红书笔记封面,尺寸3:4,内容:“百元搞定全脸妆!💄学生党必入的5款平价彩妆,效果堪比大牌✨

生成旅行拍照姿势主题的小红书笔记封面,尺寸3:4,内容:“海边怎么拍才不游客照?🌊9个超显腿长的拍照姿势,闺蜜夸我像杂志模特!”

生成周末Citywalk路线推荐主题的小红书笔记封面,尺寸3:4,内容:“成都建设路漫步地图🍃咖啡+书店+小众美术馆,一天拍出99张氛围感照片!”

文案,你也不用自己想,直接按我设计的这个格式发给任意AI即可,比如千问。生成xx主题的小红书笔记封面,尺寸3:4,内容:xxx。

6)万能的手账风格

来自Gemini 3 Pro的强大基模,使得Nano Banana Pro支持各种图文混排、多语言混排、多格式混排,以及你能想象的各种混排。

所以,手账风格天然适合Nano Banana Pro。

比如这个参考自藏师傅的提示词,它混杂了真实图片、虚拟图片以及多语言。

帮我生成一张拼贴手账风格的成都旅游笔记,上面记录着自己的行程以及路上的照片等,文字同时配备中文、韩语和英语。

用一幅图介绍堆排序算法流程,用小黄脸的表情包来可视化展示, 表情越开心,代表数值越大,并提供伪代码,手账风格,4:3尺寸。

手账风格,中文讲解咖啡的制作过程,4:3尺寸。

总之,万物皆可手账。

7)意外之喜

测试中,还有一些意外之喜,竟然无比的真实。

平平无奇的手机拍摄,在一个石碑上刻着李白的《蜀道难》,繁体,行书。

写实风格,一个传呼机屏幕写着:不好,香蕉来了。

画一个Transformer的架构图。

写在最后

测了一整晚,从昨晚10点到凌晨4点。

这是我,第一次对一个模型感到害怕 。这种害怕,不是因夜晚的气温骤降而冷得发抖,而是对一个模型的边界感到不安。

似乎,有一种人类即将失守的寒意,正要倾泻而来。

以至于,有很多case我都不能把他们放出来。因为,这个模型“从有生无”的能力实在太过强大,有着一种难以描述的越界感。

仿佛我不是在测试一个模型,而是在窥视一个正在形成的新物种。

所以,我已对全文做了标识:

本文所有图片,均来自人工智能生成。

而测试平台,来自lovart.ai

作者:沃垠AI

来源:沃垠AI

]]>
Lovart + Nano Banana AI怎么玩?完整工作流! //m.clubpenjuin.com/376571.html Mon, 17 Nov 2025 07:35:20 +0000 //m.clubpenjuin.com/?p=376571

 

别人用 Lovart 生成一张图要调半小时,懂行的人 3 分钟出 8 套方案——差别只在 Nano Banana 这几颗“暗键”:Seed 锁脸、LoRA 叠材质、负向关键词秒去水印,再用 Lovart 的隐藏 StyleTree 批量跑图,直接省掉 90% 后期。干货已备好,会用的马上开挂,不会用的还在盲调参数。

上次写完 Nano Banana 和 Lovart 的趣味结合,当时我说还有一些脑洞等有时间再为大家补充,好好好现在趁着会员还热乎赶紧把新的想法实践了一下给大家端上来。

我们在原生对话框中探索 Nano Banana 的可能性,但要产出套图、批量化、体系化的内容,像 Lovart这样的 Agent 会撑起更丝滑的工作流。比如今天我要尝试的这些玩法,更多玩法已上新,就是现在,和我一起来试试!

上链接:https://www.lovart.ai/

下列图片均为AI生成,文中提示词内容有AI参与优化,文章内容为阿真纯手搓,图片细节有问题都怪 Nano Banana,如果文章内容有错别字以及废话多的情况都怪阿真,谢谢大家理解哎嘿。

目录

1. 稳定二创输出

2. 多角色漫画

3. 英语学习课件

4. 制作学习讲座

5. 图片分镜视频一条龙

6. 模拟竞生游戏

7. 小结

1. 稳定二创输出

比如想给我们芙利莲尝试多个招式场景的效果。

图1是原图,后面是 Lovart 给我的结果。

提示词:使用Nano Banana模型,为角色创作动态分镜序列,展现各种电影化视角、表情和魔法瞬间,保持角色设定和形象不变。

NB模型有一点就是图像不够清晰,图片还需要二次放大。

Lovart:小问题,一条龙服务,包到位的。

下方是对比效果(笑死,对比效果Lovart自己做了,不要太贴心):

最简单的二创就从这里开始了。

基于 Nano Banana 强大的能力,一个角色可以稳定,多个也可以稳定,那么做别的也可以啊。比如多角色漫画,可以试试!

2. 多角色漫画

比如我想让芙利莲带着2个不知名的我AI生成的小角色露芙和蘑菇头开启一场探险游戏。

选中画布中我们的3张图片,Tab 一下,然后输入提示词:

提示词:

使用NanoBanana模型,根据3个主角进行多页单独的漫画分镜创作:每页1-2个镜头,完整迷你故事情节,丰富的表情动作变化,彩色漫画风格,包含对话框、心理独白、音效文字。

我这里提示词没有写过多情节,所以看起来故事不够清晰完整,大家可以在提示词中加入详细的故事情节。

等一会儿会看到输出图片:

这里出了个问题就是因为Nano Banana总是参考原图比例,因为我这里有图片比例没有修改,所以出来了方形的图。

新的痛点有了,上传的图片比例和想要输出的图片比例不一致,每次调整比例很麻烦?

我有一妙计,免费且方便。

如果需要在修改图片的同时,扩展图片画面,那么可以这样:

修改比例后输出漫画效果(篇幅问题,这里放一小部分):

提示词「AI优化」:

使用NanoBanana模型,根据3个主角进行10页单独的漫画分镜创作:每页1-2个镜头,完整迷你故事情节,丰富的表情动作变化,彩色漫画风格,包含对话框、心理独白、音效文字。

在被迷雾笼罩的远古森林里,银发精灵法师、淘气的蓝发小精灵和呆萌的蘑菇小子组成探险小队,他们一路破解会唱歌的荆棘迷宫、智斗巨石守卫、闯入影子怪物盘踞的古塔,最终找到了传说中的黎明之石。

但是,这时候大家要说了,纯英文的怎么办啊!

我又有两招。利用英文,或者做空对话框。哈哈快来继续学。

3. 英语学习课件

继续,我有3个角色,甚至这里可以用自己的真实照片做参考。用自己或者小朋友的照片生成学习漫画也不错。

比如生成连续性漫画故事,一致性妥妥的,还包带加入四级生词的。故事内容也挺有趣的哈哈。

生词我要求它标红也可以。可能文字多了会有细微的错误,但是很容易就可以修改。

提示词「AI优化」:

使用NanoBanana模型,绘制一部8页的彩色漫画,主角为上传的三位角色(猫、小女孩、小男孩),保持人物形象一致。

漫画要有连贯的故事情节,8页连在一起构成一个完整的冒险故事。

对话要求:

1. 每一页都要有英语对话气泡。

2. 对话中出现英语四级词汇时,请用红色标注(highlight)。

3. 气泡位置要合理,清晰易读。

画面要求:

1. 每一页都要是彩色漫画,风格明亮清晰,适合儿童读物和语言学习。

2. 背景要多样化(室内、校园、街道、森林等),避免单一场景。

3. 分镜景别要有变化(远景、中景、近景、特写等)。

4. 强调角色的情绪变化,增加故事性和趣味性。

想加入中文英标例句等,还可以看看参考之前那篇,将两者结合起来。

4. 制作空对话框

如果我们不想要英文内容,那么做成空对话框也可以。参考我这个:

提示词「AI优化」:

绘制一组10张连贯的三格或四格漫画,每张漫画都包含3-4个分镜,总共形成一个完整的故事。

主角为参考图片中的角色,始终保持形象一致。

每一格都有空白的对话气泡,请保持气泡中没有任何文字。

要求:

故事要有连续性,10张漫画连贯起来构成一个完整的剧情发展。

每张漫画的4个分镜景别要有多次变化。

背景场景需要在不同漫画中切换。

保持整体风格统一,可爱、卡通、清晰的漫画风格。

角色表情和动作要丰富,强调故事感和情绪变化。

敲黑板!!

两个知识点,一是要记得首先参考图比例要改成我们想要的比例,这样输出的比例才是我们想要的比例,这点非常重要。二是遇到有的多个漫画白色边框比较少的,还是可以用我前面的方法,加个底框,合并,这样就有白框了。操作方法如下:

直接自己添加文字也可以。

和之前一样,记得做好了之后,合并背景和文字层再导出。

5. 图片分镜视频一条龙

基于 Nano Banana 的一致性和 Lovart 的批量功能与智能多协作,我们现在制作更精良和一致的视频也变得更加轻松了。

开局一张图,开局我只有下面这张图:

我把这张图给Lovart,然后使出「秘技 · 提示词」,就得到下面的:

提示词:

使用Nano Banana模型,参考所给图片的角色与风格,生成 8 格连续分镜(起承转合),保持角色关键识别点一致;每格使用不同镜头语言与构图(大全景、近景、特写、俯拍、仰拍、运动镜头),呈现丰富表情与动作。

一致性与连贯性非常感人。

数量自己修改,提示词非常通用,改改分镜数量就可以了。

再让它生成视频,然后剪辑工具启动一下拼接加音乐:

提示词:

使用HaiLuo-02模型生成一段无缝衔接的视频,过渡自然,动作流畅,光线与环境保持统一,从开始到结束呈现丝滑连贯的效果。

6. 模拟宠生游戏

还有个脑洞,还是基于@赛博禅心 大聪明老师的长图和模拟人生的发散,做了个模拟宠生的小提示。

基于我们上传一张宠物的图,会无限延伸宠物超进化的形态(逐渐抽象哈哈哈):

看清澈的小猫咪逐渐进化成终级形态哈哈哈,下面是原图:

它会先输出过程图:

然后给我们长图,看看猫主子的《喵星修仙传》:

还可以有更多离谱的,欢迎各位铲屎官多多尝试。

提示词如下(基于个人创意,AI加强发散优化):

【插图生成部分 – 使用Nano Banana模型】
基于用户上传的宠物照片,生成6张进化阶段插图,要求:
-参考原图:只需保留1-2个最显眼的特征(如眼睛颜色、主要毛色或独特斑纹),其他部分可以大胆改变
-进化设定:幼体形态→少年形态→成年形态→元素觉醒→传说形态→究极神话形态-变化幅度:每个阶段都有显著变化,体型、外观、能力特征大胆创新,只要保持微妙的相似感即可
-视觉风格:卡通矢量描边风格,扁平化设计,粗线条轮廓,单色纯净背景
-创意自由:可以添加翅膀、触手、机械部件、元素光效、神话特征等夸张元素
-英文标注:每张图片包含对应的英文标签(Baby / Teen / Adult / Mystic / Legend / Ultimate)
-图片规格:适合网页嵌入的高清格式【HTML长图网页生成部分】创建一个竖向长图网页,
技术要求:
-页面尺寸:宽度1080px,自适应高度,移动端友好
-整体布局:干净简洁,充足留白,舒适阅读体验
-字体设置:主要文字38px,标题更大,确保移动端清晰可读
-结构组成:
1. 顶部标题区:抽象搞笑中文主标题如”[宠物名]修仙日记:从土狗到宇宙霸主的沙雕进阶路”
2. 插图嵌入区:依次插入6张Nano Banana生成的进化插图
3. 配文说明:每张插图下方2-3行超级搞笑抽象的中文解说,用梗用谐音用沙雕语言,重点词汇加粗突出
– 示例风格:**第3阶段:社会你狗哥**
——
开始戴金链子抽华子,眼神透露出”你瞅啥”的霸气
-**第5阶段:赛博朋克宠**
—— 身体70%已被机械改造,但还是会因为看到骨头而尾巴摇成螺旋桨
4. 底部总结:超级抽象搞笑的收尾段落,如”从憨憨萌宠到维度破坏者,这就是爱情的力量吗?”
-语言风格:大量使用网络梗、谐音梗、沙雕表达、抽象比喻,让人忍俊不禁
-视觉效果:温馨明亮配色,插图与沙雕文字搭配和谐,支持截图分享-交互优化:适配手机屏幕,滑动流畅,加载快速
最终输出:一个包含6张大胆进化插图和爆笑抽象文案的完整HTML长图网页,展现专属宠物的离谱变化历程。
Sep 5, 2025

小结

笑死,创意太多了,根本写不完,充了年费会员,以后有机会还能写,今天就先到这里了🤣

我是 Lovart 深度用户了,个人非常喜欢这种有图片视频拖进一个画布的方式,查找和调用非常方便,选择图片,涂鸦标注,直观输出这种也是很强大,还有选择多张图片,Tab一下输入提示词是最好玩的,非常丝滑。

在Nano Banana 的加持下,Lovart 向着更高效的生产力工具迈进了一大步。

越来越好玩了,如果今天的内容对大家有帮助,欢迎大家给阿真猛猛三连鼓励!98加满~!

作者:阿真Irene

来源:阿真Irene

]]>
谷歌nano banana图像模型发布官方宝典! //m.clubpenjuin.com/376454.html Fri, 14 Nov 2025 03:42:10 +0000 //m.clubpenjuin.com/?p=376454

为了帮助大家更好地认识Nano Banana(又名Gemini 2.5 Flash Image):Google最新、最快、最高效的模型。

其原生多模态架构可一步处理文本和图像,从而解锁对话式编辑、多图像合成和逻辑推理等强大功能。

谷歌官方推出了最强提示词,教你如何写好故事!赶紧往下看~


01 逼真写实场景

对于热衷写实主义的你,直接使用摄影术语。

机位、镜头类型、风格、光影、细节这些元素都考虑进来,引导模型生成逼真的效果。

  • 提示词模板:

一张具有照片级真实感的[镜头类型],拍摄对象为[主体],[动作或表情],场景设置在[环境]中。场景由[灯光描述]照亮,营造出一种[氛围]的气氛。使用[相机/镜头详情]拍摄,强调[关键纹理和细节]。图像应为[宽高比]格式。

  • 代码块模板:
A photorealistic [shot type] of [subject], [action or expression], set in[environment]. The scene is illuminated by [lighting description], creatinga [mood] atmosphere. Captured with a [camera/lens details], emphasizing[key textures and details]. The image should be in a [aspect ratio] format.
  • 提示词大意:

一张写实风格的特写人像:一位日本老陶艺家,脸上被岁月与阳光刻下的深深皱纹,露出温暖而睿智的微笑。他正仔细端详一个刚上釉的茶碗。场景位于他质朴、阳光充足的工作室。柔和的黄金时刻光线自窗外倾泻而入,凸显陶土的细腻纹理。使用85mm人像镜头拍摄,带来柔和的背景虚化(bokeh)。整体氛围宁静而老练。竖版人像构图。

  • 生成的图片:
一位年长的日本陶艺家的照片级写实特写肖像

02 风格化插画和贴纸

生成贴纸、图标、插图或素材时,明确说明样式并要求使用透明背景,你要把风格说清楚。

如果有特殊要求,例如白底或透明底,需要在提示词展现。

  • 提示词模板:

一张[风格]贴纸,主题为[主体],具有[关键特征]和[色彩搭配]。设计应包含[线条风格]和[阴影风格]。背景必须是透明的。

  • 代码块模板:
A [style] sticker of a [subject], featuring [key characteristics] and a[color palette]. The design should have [line style] and [shading style].The background must be transparent.

  • 提示词大意:

一张可爱风(kawaii)贴纸:一只开心的小熊猫戴着迷你竹叶帽,正咀嚼一片绿色竹叶。设计使用粗壮、干净的描边,简单的赛璐璐上色,配色鲜艳。背景必须为白色。

  • 生成的图片:
一张可爱风格的贴纸,上面是一只快乐的小熊猫

03 图片文本渲染

Gemini 在渲染文本方面表现是非常出色的。

只需要清楚说明文字、字体样式(描述性)和整体设计,效果和质量就非常棒。

  • 提示词大意:

为[品牌/概念]创建一张[图像类型],并渲染文字“[要显示的文字]”,字体风格为[字体风格]。设计应为[风格描述],并使用[色彩搭配]。

  • 代码块模板:
Create a [image type] for [brand/concept] with the text "[text to render]"in a [font style]. The design should be [style description], with a[color scheme].
  • 提示词大意:

为一家名为「The Daily Grind」的咖啡店设计一个现代、极简的Logo。文字使用干净、粗体的无衬线字体。设计带有一个简洁、风格化的咖啡豆图标,并与文字无缝融合。配色为黑白。

  • 生成的图片:
为一家名为“The Daily Grind”的咖啡店设计一个现代简约的徽标

04 电商摄影

套图有救了!品牌推广广告,主打一个专业,非常适合为电子商务、广告或品牌宣传制作清晰专业的商品照片。

不同机位,布景打光和卖点展示,通通不在话下。

  • 提示词大意:

一张高分辨率、工作室灯光下的产品照片,拍摄对象为[产品描述],背景为[背景表面/描述]。照明使用[照明设置,例如三点软箱设置]以达到[照明目的]。相机角度为[角度类型],以展示[特定特征]。超写实风格,焦点锐利地集中在[关键细节]上。[宽高比]。

  • 代码块模板:
A high-resolution, studio-lit product photograph of a [product description]on a [background surface/description]. The lighting is a [lighting setup,e.g., three-point softbox setup] to [lighting purpose]. The camera angle isa [angle type] to showcase [specific feature]. Ultra-realistic, with sharpfocus on [key detail]. [Aspect ratio].

  • 提示词大意:

一张高分辨率、影棚布光的[产品描述]产品照,置于[背景表面/描述]上。灯光为[布光设置,如三点柔光箱布光],用于[照明目的]。机位为[角度类型],以展示[特定卖点]。超写实,对[关键细节]进行锐利对焦。[纵横比]。

  • 生成的图片:
一张极简陶瓷咖啡杯的高分辨率产品照片,采用工作室灯光

05 极简风格和负空间设计

非常适合用于创建网站、演示或营销材料的背景,以便在其中叠加文字。

Less is more,极简主义与留白设计的福音。

  • 提示词大意:

一张极简风格的构图,拍摄对象为一个单独的[主体],放置在画面的[右下角/左上角等]。背景是一片广阔的、空旷的[颜色]画布,创造出显著的留白空间。使用柔和、微妙的照明。[宽高比]。

  • 代码块模板:
A minimalist composition featuring a single [subject] positioned in the[bottom-right/top-left/etc.] of the frame. The background is a vast, empty[color] canvas, creating significant negative space. Soft, subtle lighting.[Aspect ratio].
  • 提示词大意:

一幅极简构图:一片精致的红色枫叶位于画面右下角。背景是一整片空旷的米白色纯色画布,为文字留出大量留白。来自左上方的柔和、漫射光。方形图像。

  • 生成的图片:
一幅极简主义构图,画面中只有一片精致的红枫叶

06 漫画风格 / 故事板

以角色一致性和场景描述为基础,为视觉故事讲述创建风格。

连续艺术创作者的顶级prompt。

  • 提示词大意:

一张[艺术风格]风格的单幅漫画面板。前景中,[角色描述和动作]。背景中,[场景细节]。面板包含一个[对话/说明框],内有文字“[文本]”。照明营造出一种[氛围]的气氛。[宽高比]。

  • 代码块模板:
A single comic book panel in a [art style] style. In the foreground,[character description and action]. In the background, [setting details].The panel has a [dialogue/caption box] with the text "[Text]". The lightingcreates a [mood] mood. [Aspect ratio].
  • 提示词大意:

一格粗粝的黑色电影风漫画,高反差黑白墨线。前景中,一位穿风衣的侦探站在闪烁的路灯下,雨水打湿了他的双肩。背景中,一家荒凉酒吧的霓虹招牌倒映在水坑里。顶部的旁白框写着:「在这座城市,想守住秘密并不容易。」用光强硬,营造戏剧而沉郁的氛围。横向画幅。

  • 生成的图片:
采用粗犷的黑色电影艺术风格的单幅漫画书画面

谷歌通过发布官方提示词,完美诠释了什么叫AI科技平权,人人都能创作高质量的图片。

最后,本次定价也相当惊喜:

Banana模型现已通过Gemini API和Google AI Studio(面向开发者)以及Vertex AI(面向企业)提供。

Gemini 2.5 Flash Image 的定价为每 100 万个输出令牌 30.00 美元,每张图片包含 1290 个输出token令牌(每张图片 0.039 美元)。所有其他输入和输出模式均遵循Gemini 2.5 Flash定价。

每张图片仅需0.039美元,按照现在的费率,一张图不到3毛钱

比OpenAI便宜太多了!网友纷纷表示,谷歌请奥特曼吃香蕉呢~

总之一句话,简单又好用!还等什么呢?

]]>