这有啥乱拳打死老师傅的?
这背景一看就是disco diffusion级的,别说tiktok了,随便谁都能自己整个一样的。
这个领域现在是两条线。一条线是神仙打架:OpenAI的DallE2,Google的imagen,Google的parti。特点是使用门槛比较高,或者干脆不开放公开使用。生成效果逻辑性比较强,图像越来越真实,细节经得起显微镜放大,也能理解足够复杂的文本。
另一条草根线,特点就是开源,免费或者使用成本非常便宜:disco diffusion,mid journey,以及最近忽然大火的stable diffusion。特点是生成效果艺术性比较强,乍一看感觉很不错很抓眼球。但细节和逻辑性方面存在很多问题。输入的文本,与其说是句子,不如说是一堆单词的组合。
但stable diffusion虽然是初创出品,但可能是个例外。丫也是用了4000张A100训练出来的,和DallE2可以算是互有胜负了。
这里面disco diffusion和stable diffusion都是可以自己架张显卡就能离线随便玩的。你要有10亿用户,你也可以分分钟交付给10亿用户玩。
这个领域目前没tiktok什么事。
【 在 hgoldfish 的大作中提到: 】
: 突然间,AI文字转图片成为了全球科技业的一大流行技术趋势。几周前我们报道了“新一代梗图之王” DALL·Emini,一个脑洞十分清奇的文字转图片AI小工具。当时我们也提到,包括谷歌、OpenAI 等大公司和顶级研究机构都在开发相关模型,就连时尚杂志《COSMO》都采用AI来设计杂志封面。
: 然而令许多人没想到是:
: 就在各家硅谷大厂斥巨资研发、砸了无数的人力、发了无数的论文,却还在测试相关技术的时候,TikTok居然异军突起,首先把AI文字转图片做到了产品里,而且直接交到了全球十亿用户的手上……
: ...................
--
修改:lvsoft FROM 180.111.50.*
FROM 180.111.50.*