深圳、广州和北京2019年7月24日 /美通社/ -- 7月16日,“2019数据科学研究与商业应用国际研讨会”在清华大学深圳国际研究生院隆重举行,该活动是“清华-伯克利深圳学院2019年度思享会”系列研讨会之一,由清华-伯克利深圳学院(TBSI)和华扬联众数字技术股份有限公司联合主办;清华-伯克利深圳学院共同副院长陈伟坚教授与华扬联众研发副总裁李响博士担任研讨会主席;华扬联众首席技术官章骏博士亦受邀出席本次会议。
本次研讨会旨在讨论数据科学的关键问题和核心技术,以及数据科学在诸多领域的创新应用。聚焦于大数据分析方法、数据驱动的工程实践、企业大数据、服务和健康大数据、大数据的应用研究、Tensor Flow数据分析平台、数据挖掘中的信息安全和隐私保护七个主题,邀请了来自宾州州立大学、加州伯克利大学、迈阿密大学、清华大学、伊利诺伊大学等一流高校的国际顶尖科学家,以及富华科工业、华为、华扬联众、腾讯等知名企业的产业界精英作为演讲嘉宾,分享他们的观点与研究。
美国国家工程院院士迈阿密大学杰出工程研究教授Daniel Berg教授(IEEEFellow,INFORMS Fellow)、伊利诺伊大学厄巴纳香槟分校(UIUC)计算机科学系Chengxiang Zhai教授(ACM Fellow),为参会嘉宾带来了两场精彩的主题报告。Daniel Berg教授在演讲中表示,随着需求的不断增加,服务业的覆盖面与从业者正在逐年增加;在一些行业中,我们很高兴看到科技正在使之更加高效的运作、发展,但是我们也发现在充斥着人际关系的服务行业,许多问题是不能依靠我们现有的技术解决的,这就是我们目前所面对的瓶颈,也是未来研究的方向。Chengxiang Zhai教授就大文本数据的分析、挖掘与应用,系统地讨论由“大文本数据”带来的机遇与挑战,强调将人类带入文本分析循环的必要性,并讨论了构建通用Text Scope的主要挑战以及未来研究的一些重要方向。
宾夕法尼亚州立大学电力工程与计算机科学系Constantino Lagoa教授分享了如何从数据中抽取额外的信息,提出了利用动态系统的特征,根据控制论对行为进行控制的方法。加州大学伯克利分校工业工程与运筹系Chengju Wu博士介绍了利用机器学习对癌症检测和诊断的方法。清华-伯克利深圳学院黄绍伦教授以知乎数据为例,讨论了如何通过自然语言处理来进行情感分析。清华-伯克利深圳学院陈伟坚教授为与会嘉宾介绍了企业数据的分析和应用,探讨了隐私保护下数据匹配的步骤,以及贪婪算法和指派模型两种数据匹配方法。卡耐基梅隆大学电子和计算机工程系Pei Zhang教授带来了在不干净的物理网络数据中寻求物理信息的演讲,讲述了一种结合已知物理现象来减少初始训练数据的总量、并提高学习模型的效果,进而从现实世界传感器中获取信息的物理学习方法。
华扬联众研发副总裁李响博士结合华扬联众目前的技术研发与商业应用经验,分享了关于数据安全与保密的机器学习框架,展示了华扬联众为实现模型效果与用户隐私之间的平衡,建立的一种数据交换、生产和模型发展的新框架。腾讯研发总监郑冶枫博士介绍了医学图片分析深度学习的机会与挑战,并阐述了Med3D、CycleGAN、及VideoGAN等有效应对训练数据缺失的方法。华为云物联网技术研究主管杨玮玮分享了物联网和边缘计算的工业应用,提出电源、电网、用户带来的海量全领域信息,为大数据时代下的数据应用、数据处理、数据接入提供可能;同时,物联网的快速发展也有效带动了智慧城市建设,智慧路灯、智慧环保、城市综合治理。腾讯互动媒体副总裁、互动媒体学院院长陈峭霖博士以腾讯的游戏数据挖掘为例,介绍了腾讯交互娱乐中的数据科学,以及如何在整个客户生命周期中,应用各种机器学习技术来改进用户游戏体验和优化精准营销。富华科工业研发经理占兆武博士介绍了数据科学对工厂智能化的促进作用及应用案例,提出了利用数据挖掘算法实时提取有效特征,依据提取的特征结果预测刀具的受损状态,结合机器学习方法形成智能化生产系统的闭环。
本次研讨会吸引了百余名高校师生、产业界合作伙伴的全程参与,与会嘉宾针对机器学习建模的局限性、数据挖掘的隐私保护、以及工业界应用中的挑战等方面与演讲嘉宾提问交流。国内外数据科学领域的12位专家学者为本次研讨会带来了2场主题报告、10场大会报告,为大家带来了一场高水平、高标准、国际化、前沿化的学术盛宴。