领略数据之美—— 数据科学系列讲座第五、六讲举行


  本周,来自腾讯的靳志辉高级研究员和一号店的肖凯高级研究员做了本期经济学科数据科学与实验系列讲座的最后两讲。

     第五讲报告由靳志辉先生主讲,讲座分为两个部分,一部分讲靳志辉先生学习的经历,主要跟正态分布,统计学相关的内容,第二部分的报告内容讲腾讯广告部大数据处理的相关内容,尤其是和人的挖掘相关的内容。互联网广告有几种商业模式。一种是按照曝光收费,即不管受众有没有点击广告,只要广告被推送给受众就产生广告费。一种是按照点击收费,即受众点击了推送的广告才产生广告费。这两种模式适用于不同的场合。从流量的角度来看,腾讯每天能创造的广告价值是巨大的。用户分析的主要目的是寻找用户的商业兴趣,常用的工具有文本语义分析和User-Item矩阵分解,以保证推送广告的过程中的多样性,和用户体验。
    
    肖凯的讲座介绍了一些常用的python扩展包,pythonR语言之间的比较。并给出了三个使用python的具体案例,第一个是抓取数据,第二个是最优化,第三个是做一个产品原型。通过案例演示了python的强大功能,同时肖凯还强调,工具不是最重要的,最重要的是问题,问题是一个方向性的东西,如果方法很好,工具很多,但是问题找错了,整个就失败了,所以提出正确的问题是最重要的事情,给同学们的研究提供了很好的启发。





    六场讲座下来,同学们对数据科学有了一个总括性的了解,同时,又对数据科学产生了极大的兴趣。这次系列讲座的初衷是,通过业内精英的报告,能够给同学们带来触动,带来新鲜感,点燃同学对数据科学的热情。从每场讲座互动环节的火热情况来看,讲座的效果已经达到了。虽然本次系列讲座暂时告一段落,今后,学院还将邀请更多的数据科学家来分享他们的经验和故事。