918博天堂

  •  光华首页
  •  讲授项目
    本科 学术硕博 MBA EMBA 高层治理教育 管帐硕士 金融硕士 贸易分析硕士 数字教育 课程推荐
  •  北大主页
  •  用户登录
    教人员登录 学生登录 光华邮箱
  •  教怨匦聘  捐赠
English
918博天堂(中国区)官方网站
918博天堂(中国区)官方网站

学生风采

首页 > 学生风采 > 正文

学生风采

云端沙龙丨朱宏图:数据产品开发的一些思虑

2020年12月19日 ,北

功夫:2020-12-22

2020年12月19日 ,北京大学光华治理学院2020技易分析硕士进行了本学期第四次行业沙龙 ,本次沙龙约请了滴滴出行首席统计学家朱宏图教员 ,由朱教员向我们分享了行业内数据产品开发过程中的一些思虑 。

690E8FC8493452733E0EDEDC405_46AC913E_BD462


一、什么是数据产品

首先 ,朱教员和我们一路探求了什么是数据产品 。朱教员以为 ,数据产品是一类产品的统称 ,分歧业务人员眼中数据产品的界说都分歧 ,总的来说 ,数据产品是通过网络和挖掘数据的价致反为受多(用户 ,企业 ,和当局)创造价值(好比 ,某种决策/行为)的一种产品大局 。例如 ,狭义来看 ,数据产品往往体现为报表型、工具型和定造服务型等 ,广义来看 ,遥感影像、医学图像甚至视频分析等都是数据产品的一种大局 。目前 ,数据产品依附语音技术、天然说话处置、推算机视觉和大数据技术已宽泛利用于各个行业 ,如医疗、零售、教育、交通等等 。

9EE6908274BCFD2CC76C1E20DA1_42AA35F0_8B588


二、数据产品的三个主题层

朱教员强调 ,一个成功的数据产品由三个主题层 ,蕴含一个中心(利用层)与两个根基点(数据层和算法层) 。以5G红表成像测温为例 ,利用层是要做到在公共场所中(像飞机场、火车站等)若何无赣注无接触、且急剧精准的鉴别高温人员;在数据层 ,网络到大量有很高精准度的训练数据集 ,通过遴选固定人群呈此刻各类公共场所中 ,并同时采集他们红表热成像数据和提问的信息;在算法层 ,用人脸鉴别技术与红表热成像等有关的算法技术来训练统计模型以精准地预测人体体温 。

42E1D230D3B8CD2934920FC9F60_E2F21462_81A15


三、数据产品开发的根基步骤

朱教员将数据产品开发的过程总结为四个根基步骤 ,第一步是业务指标的拆解 ,必要从业者凭据业务指标 ,提出数据产品的需要 ,思虑数据产品的主张及其可能对业务带来的援手;第二步是数据的提取 ,将上一步相识的需要转化为具体的数据指标KPI ,有主张地提取有关和有效的数据;第三步是底层数据建设 ,经过数据洗濯、整合数据、缺失值处置等预处置步骤 ,进行画像建设和特点提取 ,成立知识图谱;第四步是?榻ㄉ ,在每个?榈目⒅胁恍萁心P偷难≡裼敫慕 ,直达到到肯定的正确度 。朱教员强调 ,业务指标的拆解、高明的算法技术与底层数据的建设是三角关系 ,它们相辅相成 ,相互作用 ,缺一不成 。

最后 ,朱教员以滴滴出行网约车业务线为例向我们分享了数据产品在业务过程中的实际 ,携带我们拆解了网约车供需模型中的业务指标 ,并且通过具体的案例让我们感触到了底层数据建设的沉要性 。同学们听完后意犹未尽 ,纷纷提出了自己对于数据产品的思虑和疑惑 ,和朱教员积极会商算法细节以及职业远景 。


嘉宾简介:朱宏图 ,2018年参与滴滴出行任首席统计学家 ,北卡罗来纳大学教堂山分校生物统计学平生教授 ,原为MD安德森癌症中心的诊断影像学Bao-Shan Jing讲席教授和生物统计学平生教授 。现掌管滴滴统计决策科学团队和特点挖掘团队 ,携带AI科学家、工程师们为滴滴出行平台提供创新解决步骤 。2000年获得香港中文大学统计学博士学位 。重要从事统计进建、医疗图像处置、精准医疗、生物统计、人为智能和大数据分析 。2011年当选美国统计学会和数理统计学会会士 。2016年 ,荣获德克萨斯州癌症预防与钻研中心卓越钻研奖 。2020年因强化进建在网约车出行中的利用荣获Daniel Wagner卓越利用奖 。

分享

邮箱:admission@gsm.pku.edu.cn

邮编:100871

征询电话:010-62747014 / 7283

联系地址:北京市海淀区颐和园路5号北京大学光华治理学院科研楼K07

?2017 北京大学光华治理学院 版权所有   京ICP备05065075-1

【网站地图】