【AI绘画大比拼】通义万相VS文心一格：探索十种风格下的绘画生成差异！-阿里云开发者社区

一、背景

近日，通义大模型家族的新成员——通义万相已在人工智能大会上亮相。其中，通义万相的强大的“文生图”功能，不禁让我想到了去年八月由百度依托飞桨、文心大模型的技术创新推出的“AI作画”首款产品——文心一格。

那么，在类似的Prompt下，两款产品的表现将会如何呢？今天就让我们就十种风格下二者生成图像的表现力，来看看这两款产品的差异。

二、绘画生成

1、测试准备

AI绘画基础公式：Prompt= 画面主体+细节词+风格词

由于两款产品所支持的画面类型并不能一一对应，故本次测试中会手动选择两者最贴近的风格，将生成图像进行比对。个别的细节词会调换顺序，方便ai识别。

部分生成图采用文心一格——智能创作平台（ApI）手册中的生成图。

2、效果对比——左侧为通义万相，右侧为文心一格　

2.1 人像

Prompt：人像摄影，写实照片，超现实主义风格，高度详细的阴影和纹理，十分逼真，佳能35焦段，光圈1.8——默认风格

人像绘制一直是国产ai绘画模型的一大劣势，对于本次测试的两款模型来说也是如此。万相的图像整体风格很统一，但是放大后可以看到人脸处的纹理非常僵硬，眼睛瞳孔的形状变形。文心一格在画面的细节处理上要好很多，毛发非常逼真。但在词汇理解上，文心一格并没有理解prompt中的光圈一词，导致画面生成了一圈奇怪的光晕。

2.2二次元

Prompt：少女，浅蓝色头发，长发，蓝眼睛，花朵发饰，侧脸，唯美，欧式背景，日式动漫人物，二次元风格

Prompt：男孩，西装，金丝眼镜，斯文，沉稳，二次元风格

看的出来两款产品在二次元风格这一模块中做的都很不错。两次测试下来，万相给我的感觉更偏向于韩式漫画的风格，所创作出的图像都会带一些３D的感觉，人物都比较立体。文心一格的图像画风更接近于我印象中的传统二次元，但是图一的测试中，没有像万相一样把“欧式背景”体现出来，图二的人物我很喜欢，但是背景有一些变形。

2.3 3D动漫人物

Prompt：古风动漫少女，唯美春日花神，面容精致，毛发精致，3D立体，花朵盛开，CG，超细节，超高清——水彩画风格

两款产品生成的动漫人物各有千秋，万相整体色调和背景相融合，都是粉色，细节也很精明，眼部妆容色彩如果能淡一些可能会更好。文心一格的画面颜色也做了统一，面容相对来说更为精致立体，如果能把春日花神的特征体现出来也会更好。

2.4素描

Prompt：老人，人像写真，皱纹，笑容灿烂

和人像相同，万相的整体画面比较暗，文心一格的画面比较亮。万相的图像放大来看还是会感觉有一些“丝滑”，和图片中老人的皱纹这一特征比较违和，但是总体来说以及非常精细了。而文心一格的图像老人的额头一眼就看出来生成错误，大面积的复制粘贴，并且图像中老人的脸也没有展示完整。素描这一风格上文心一格还有待加强。

2.5动物

Prompt：爱情鸟绿，具有活力的异国绿色，动物，鹦鹉，高清，轮廓清晰完整，高清

这里我选的都是默认风格，想生成出写实风格的鹦鹉。万相所生成的图像更接近于我脑海中的鹦鹉图，羽毛的细节如果可以优化一下更加细致就更好了。文心一格的画风更接近于画作，但是眼睛这里生成有bug。整体来说我更喜欢万相的生成内容。

2.6自然

Prompt：向日葵，油画风格，细腻，色彩鲜艳

万相油画风格下的向日葵，还带了光影的绘画，这一点让我很惊喜！并且远处的向日葵并没有生成我以为的统一复制的风格，颜色也非常鲜艳。文心这边的向日葵没有突出色彩鲜艳这一特征，并且花瓣内测的颜色也没有想左侧一样渐变。本次油画风格我也更加喜欢万相的图像。

2.7古诗词

Prompt：举头望明月，低头思故乡

对国内的ai绘画模型来说，古诗词也是一大难点。因为不单单要理解、绘画出诗句中的景象，所生成的图像还要带有一定的意境才算合格。本次测试的文本“举头望明月，低头思故乡”是我国著名诗句，表达了作者的思乡之情。

万相所生成的图像描绘了“举头望明月”，画面色调也采用了冷色调，但是并没有看出“低头思故乡”，并且从人像背景也并不能看出是古代场景还是现代场景。文心所生成的图像自动匹配了国画风格，意境很到位，但是同样也没有表现出思乡之情。但总体来说生成的图像是在合格线上的。

2.8古风场景

Prompt：游戏梦幻唯美新中式风景，超高清，细节刻画，沐浴在花瓣里，满天花瓣，飘渺电影般环境，明亮清晰

左侧万相生成的图像中漫天花瓣飞舞，河道两边有中式的小亭子，让人看到的第一眼以为是哪个古风游戏的场景截图，画面非常唯美。如果说左侧是游戏内的场景的画，右侧文心一格生成的镜像更像是插画设计稿，图中的建筑绘画的非常细腻。这一次的测试两款产品各有千秋。

Prompt：群山，古画，红枫叶

在古画场景测试中，万相的“群山”细节还有待优化，枫叶多的地方画面会自动模糊，总体还是不错的。相对而言我更喜欢右侧文心一格生成的图像。每一座山的细节都各不相同，同时枫叶和枫叶交错的地方也没有模糊，还是很清晰。

2.9科技场景

Prompt：生态城市，未来城市，外星城市，科技城市，自然生态，未来生活，生态绿植

本次测试了未来科技生态场景。两者的细节绘画都很不错，相比较而言我觉得万相的画面更加富有科技感，符合我脑海中的场景。文心一格的色调如果再明亮一些，远处背景的建筑再庞大一些会更好。

2.10插画

Prompt：都市，时尚，咖啡，办公，明亮，活力

插画风格下两款产品生成的图像还是有些差异的。左侧的万相生成的图像堆积了许多元素但不违和，很具有设计感。而右侧文心生成的插画更加注重画面的内容。

三、结论

经过本次测试，我个人认为万相在生成3D风格的人像和自然场景方面表现出色。其生成的人像逼真度高，有立体感，能够准确捕捉到人物的面部特征和表情。而在生成自然场景方面，万相能够细致地描绘出大自然的细节，如植物的纹理、水流的流动等，让画面更加生动。在油画风格中，万相所绘制的图像也非常惊艳。画面色彩鲜艳，构图美观。

另一方面，文心一格在生成二次元图像和古风画方面表现突出。其生成的二次元图像色彩鲜艳，线条流畅，能够准确还原出动漫角色的特征和风格。在生成古风画方面，文心一格能够恰到好处地表现出古代绘画的质感和氛围，给人一种古典的美感。可能是因为文心一格问世较早，通义万相发布时间短的原因，所以在功能体验上文心一格给我带来的体验更好。文心一格提供了许多可供用户操作的空间，如【选择画面风格】、【添加修饰词】、【不希望出现的内容】和【图片二次编辑功能】等。这些功能对于创作者来说是极大的帮助，也提供了较大的容错率。而通义万相在这些方面可能还有进一步的优化空间。

希望在将来，通义万相能对其产品进行优化，为我们带来更好的体验。不论是提高生成效果的准确性和真实度，还是增加更多的可操作性和容错率，都能够让用户更方便地使用和创作。期待通义万相继续提升产品质量，为我们呈现出更多令人满意的画面和体验。

?社区里的小伙伴们体验过这两款产品吗？你们体验后更看好哪一款产品呢？
如果你被通义万相的细致打动，请在评论区发【1】

如果你觉得文心一格体验更流畅，请在评论区发【2】

欢迎在评论区留下你的观点，我们一起讨论?

【AI绘画大比拼】通义万相VS文心一格：探索十种风格下的绘画生成差异！