需求还是很旺盛的,用图片搜人就涉及到识别的问题,还有学术研究中图片抄袭检测,经常是偷别人八分之一四分之一,然后旋转一下放到自己论文图片中拼接上,这种以前都很难被机器发现,现在也主要靠人,有一个外国女博士就是干这个的,在自己网站上每天公布她的新发现,她自己自述完全靠肉眼一篇篇去看。有一种是可以靠机器的,就是图片自查重,比如同一篇论文里面,有几张图片中有很多子图的,图1a的右四分之一和图3b的左四分之一旋转后是相似的,这种是可以被机器发现的。
文字的话就不仅仅靠关键词了,最简单的就是全文检索,命中就可以,还可以机器按照语义和词频自动提取的主题词,这种命中的也会优先被检索出来,还有一种是搜索词虽然没在文章里出现,但是意思相近的,也可以实现匹配,这种叫语义检索。
【 在 suhangma 的大作中提到: 】
: 音频视频图片要结构化,是不是只能按照风格主题分类
: 没法很精确的结构化,因为要素太多。
: 不过,实际上,文字的结构化也没做到精确,也只是关键词
: ...................
--
修改:klbs FROM 120.244.138.*
FROM 120.244.138.*