***** - 首页 - 微博


有同学说怀疑文心一言画画的真相是汉译英再译汉,证据是让它画鼠标(mouse)它经常画不出来,给画成老鼠(mouse)。百度悄悄把你的输入文本机翻成英语,扔到什么国外开源的AI画图引擎里得到个结果再给你。

我觉得这么说就有点过于把百度瞧扁了。虽然它很扁,毕竟厚度不为零。测试了一下,bat、scale、bank、crane、trunk都能正常解释,足见应该不涉及中英互译。唯独老鼠和鼠标混淆,我觉得根本原因应该是各位过于抬举文心一言了。什么踏马mouse不mouse的,其实它就只看到“鼠”字,不懂啥叫“标”,默认给丢弃了,所以得到的全是动物。只有上下文涉及电脑之类的才会往鼠标上靠。

顺便,这回让它如愿以偿画了一支晶莹剔透的牡丹花。

同时发现个问题。让它反复生成晶莹剔透的牡丹花,它得到的全是同一幅,一个像素都不差。

在AI绘图界这是不可能的。众所周知AI画画就像张三丰打太极拳,同样的prompt每次得到结果都不一样,因为diffusion算法原理就是这样的。先产生一堆随机噪点,然后开始降噪、锐化、筛选,往你的prompt关键词上靠。

所以结论就是百度大概率用了个关键词匹配系统,看见你说“画”和“牡丹花”就把同一张现成的图片自动丢给你,以求效果稳定、不出妖蛾子。

为什么唯独对牡丹花搞这种老牛拉火车的说不清是巧方法还是笨方法?因为进入文心一言首页,底下有几个万年不变的示例问题,画牡丹花就是其中之一。这是门面,百度不择手段也要让它能圆满地自圆其说。

另一个首页示例问题是“写个太空旅行的市场分析报告”。百度的处理方法一毛一样。实现可能让活人写了一大篇,一旦发现你提到太空旅行和市场分析报告就无差别糊你一脸,根本不看语境,来来回回一字不差。

相关实验记录在此:

https://weibo.com/mygroups?gid=221012100009820647