我的最终目标是希望找到一个多维空间,这个空间里面“风格”的作品的点是接近的。
目前尝试了一条路是用一些预先标记好的艺术流派数据库(大概十几个类型,每一类几千张),去训练一个resnet,这样可以把一个作品映射成一个十几维的向量。
但是这种做法相当于是丢掉了同一个流派内部的各种不同分支----实际上,这些细微的变化本来也是不容易描述的,更多是看上去的感觉,也不太可能找到标记的数据。
这类的问题我有什么可以尝试的方向呢? 一方面是算法,另外一方面是数据。
我在考虑的方向包括:如果无法标注更细分的分类,我能不能用创作者的信息来当作风格的一个proxy。
算法方面,如果是一个普通的多维数据,我会考虑用mds这类的方法找出最大化类间距的维度。不过图像上现在是不是都流行用神经网络了..
--
FROM 114.242.178.*