百度大数据实验室隶属于百度研究院,院长为Andrew Ng, 实验室由国际著名机器学习学者张潼老师领导,主要成员都是来自相关领域的国内外知名高校或研究机构。
百度的大数据为今天的中国提供了数字化的生命:春节期间《新闻联播》报道的百度迁徙就如同中国流动的血液,百度地图里面的交通道路如同中国的复杂脉络,每天在百度的搜索记录着中国的心跳,用户在使用百度定位的请求如同中国活跃的神经元,百度地图的热力时刻在记录中国的体温。 为了解开数字化中国背后的神秘动力学面纱,我们组将通过机器学习、数据挖掘和统计物理等技术来分析挖掘自百度的大数据,试图探索这个复杂系统背后的规律,从而解决最关键的社会和商业问题,如分析百度地图大数据,洞察全世界最大人口迁徙的规律,或准确预测个体运动轨迹,实现个性化推荐;结合百度超大规模的搜索请求数据,或推测网络谣言、疾病传播的规律,或洞察国人搜索行为和内容的动态演变,等等。在这里你不但可以真刀真枪体验真正的大数据,还可以与实验室来自国内外的美女帅哥们切磋大数据绝学!
工作职责:
负责百度研究院大数据实验室的基于百度移动大数据的复杂系统的量化研究
百度海量数据的获取、清理、挖掘和建模
职位要求:
-对基于大数据的复杂网络量化、建模和优化有浓厚兴趣,对数据背后的社会学、行为学等交叉学科的研究有强烈的索欲望
-计算机及相关专业,对下列之一领域有研究:机器学习/统计学/复杂网络/统计物理/大规模优化/地理信息系统等
-熟练常用的机器学习和数据挖掘算法,并有相关的实际经验,参加过KDD Cup或Kaggle比赛的优先
-熟悉大数据处理,熟练使用Python或R,以及相关的package, 有SQL/Hive/Shark等实践经验,了解Hadoop/MapReduce等相关技术
-有人类移动(human mobility)、人群动力学(human dynamics)、群体行为学(collective behavior)或者时空轨迹分析(spatial-temporal trajectory analysis)等研究经验的将优先 (如果您对Albert Barabasi, Duncan Watts等人研究熟悉者将更佳!)
-有一定的数据可视化经验,有PostgreSQL/CartoDB/HTML5或其他时空可视化经验的优先
-有优秀论文发表记录的优先
-每周能实习3-5天
工作地点:北京上地百度大厦
实习生有标准的工资待遇并享受其他福利,感兴趣的同学请发送简历到wuhaishan@baidu.com
--
FROM 182.48.104.*