网页搜索部-S、互联网数据研发部、运维部
技术讲座
【大搜索体系介绍】
大搜索体系:百度自2000年创立以来,通过持续的技术创新,发展成为全球最大的中文网站和中文搜索引擎,作为七亿中国网民最重要的上网入口,百度索引的网页信息相当于60,000多个中国国家图书馆,每天响应来自全世界138个国家的数十亿次搜索请求,用户最快只需0.04秒即可找到他最想要的信息。
搜索是百度最核心的产品,同时也是支撑百度其他业务的平台、互联网生态最重要的平台。通过持续的技术创新,在搜索相关、自然语言处理、机器学习等技术领域处于世界前列甚至部分技术遥遥领先,使得百度的中文搜索技术在世界上一直具有巨大的优势。百度的大搜索团队肩负各平台上的搜索业务,汇聚了信息检索、数据挖掘、自然语言处理、机器学习、推荐技术、知识图谱、语音图像搜索、大规模数据处理、云计算、产品设计、交互设计等领域最优秀的人才,是百度最核心的团队之一。
百度大搜索从最早期的简单信息检索功能,通过不断的创新和完善,基于多端(PC、wise、pad)和多模式(文字、语音、图像)推出了很多越来越便利、越来越智能的搜索产品,如框计算、语音搜索、图像识别搜索、知识图谱极速智能搜索、个性化搜索、度秘等产品。未来,百度大搜索还会继续产出更多的“连接人与信息、连接人与服务”的富有想象力的创新成果,为广大网民提供更多的服务。
【大搜索体系网页搜索部-S介绍&讲座内容】
大搜索基础架构团队,满足pc搜索、移动搜索、学术搜索,支撑上百个产品线引入,上万台机器的并发处理,从万亿的网页数据中满足了每天60亿次搜索需求。快、准、全、新、稳是我们不懈追求的目标。
【大搜索体系互联网数据研发部介绍&讲座内容】
为百度提供一切有价值的互联网数据和服务,主要业务有网页和服务的收录与解析和知识图谱。
网页的收录与解析,是百度搜索的核心基础,如何把全网海量的资源全面、快速的进行收录一直是搜索引擎最大的挑战之一,需要持续优化核心算法,不断提高全网新资源发现、抓取调度与内容更新的效率,持续优化超大规模资源数据存储、传输与计算架构的性能。
知识图谱,是以实体及实体关系为基础构成的映射物理世界的知识库。目前百度构建了全球最大的中文知识图谱,是百度智能化搜索、以及人工智能重要的技术基础。知识图谱技术,包含知识表达,图谱构建,图谱检索,图谱计算等多个方面的问题,涉及信息检索、语义网、图计算等多个方向的技术,是一个创新的,不断探索和完善中的应用技术。
【运维部介绍&讲座内容】
百度运维部(Baidu SRE)目前有400多个工程师,负责超过300多个用户产品,同时接口近2W的研发工程师。运维部一直秉承着提供业界领先的服务质量的原则,助力产品的迭代创新,每天都有400多个新功能和改进上线、每15分钟内实现百度数十万台全量部署、每分钟都完成10亿次监控探测。
【主讲人】
覃安,博士,百度搜索引擎架构师。2010年博士毕业于中科院计算所,分布式系统方向;2012年加入百度,负责搜索引擎架构设计与海量数据处理相关系统的研发。在百度期间发表过VLDB等学术文章,并拥有十多篇专利。
牛正雨,博士,百度互联网数据研发部资深研发工程师。2006年获得新加坡国立大学博士学位。2010年加入百度,曾参与过query分析/网页分析/大搜检索结果出图等工作,现在参与知识图谱数据建设以及知识数据的产品应用等工作。在重要会议或期刊上发表论文20余篇,包括ACL,EMNLP和SIGIR等,拥有十余项发明专利。获得2012年度最佳百度人称号。
王栋,博士,百度运维部主任架构师,主要研究利用大数据处理和机器学习等技术提升运维的自动化水平,探索如何高质高效的保障各项业务的服务质量和用户体验。本科和研究生毕业于清华大学计算机系,同年加入贝尔实验室,从事下一代互联网技术的研发。期间获北京大学计算机系博士学位,之后加入Google,参与和负责了搜索、室内定位、广告和知识图谱等项目。2015年加入百度。
【报名连接】
http://www.sojump.hk/jq/8501020.aspx
【活动时间】
2016年6月30日周四晚上7点
【活动地点】
清华大学FIT楼1区312

讲座报名扫一扫!!
【接收实习及秋招简历】
投递简历者,7月份面试通过,将有机会获得百度秋招提前批次offer。
简历网申地址:talent.baidu.com---校园招聘----校招职位
或者:
http://talent.baidu.com/external/baidu/campus.html#/jobDetail/1/1168538183 --
FROM 119.130.87.*