在企业运营中,有很多场景需要快速便捷地完成纸质报表单据的电子化。例如, 企业各类财务报表、单据等纸质扫描文件的快速识别和结构化入库;或者大型物流、货运公司,实现纸质物流单据的快速识别和结构化自动录入,以节约人力成本。自动识别图像中表格及表格内容,结构化输出表头、表尾及每个单元格的文字内容成为企业场景中的关键技术。 该项目涉及到:
- 表格边界识别 (有边框和无边框)
- 表格中行、列识别和内容抽取
- 表格中Label的识别
- 需要支持中文识别
如果你对上述方面感兴趣,欢迎加入我们。我们需要的人才:
1. 深度学习算法设计:
掌握基于卷积神经网络的深度学习技术
有计算机视觉和图像处理经验
了解TensorFlow框架及其python接口
2. 图像算法处理:
熟悉掌握各种图像处理算法
熟练掌握c++开发
有计算机图像处理经验者优先
3. 后台服务开发:
熟练掌握C++开发
有WINDOWS平台的编程经验
了解分布式程序设计开发
*北京市海淀区东北旺西路8号中关村软件园 28号楼环宇大厦;
* 简历发送邮箱:bjwuky@cn.ibm.com
* 邮件主题格式:学校 专业 姓名
* 实习时间: 每周不少于4天,持续4个月或4个月以上,能够长期实习者优先;
--
修改:QAer FROM 111.192.163.*
FROM 111.192.163.*