本文系智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!
【智能讯 4月30日消息】近日,清华-青岛数据科学研究院举办了第二届“大数据在清华”高峰论坛,本次论坛以“站立潮头、无问西东”为主题,邀请了清华大学副校长杨斌,中国科学院院士、清华计算机系教授张钹,中国工程院院士、北京清华长庚医院执行院长董家鸿等大数据和人工智能领域的专家学者以及产业界杰出校友出席论坛。
清华大学副校长 杨斌
清华大学副校长杨斌在致辞中表示,今年正值清华大学107年校庆,清华校歌中蕴藏了“行健不息须自强”的精神,而在当今世界,数据科学或者说大数据成为重要的战略资源,数据成为国与国之间重要的利益博弈,数据科学工作者肩负着国家责任和社会责任。因此,我们身处热潮应时刻保持冷静的头脑,以深刻、敏锐的态度实现大数据事业的“创新自强”。
中国科学院院士、清华计算机系教授 张钹
在峰会主论坛上,中国科学院院士、清华计算机系教授张钹做了题为《AI与大数据的关系》的主题演讲。张钹院士认为,今天我们看到了人工智能的希望,这是因为它真正开始解决现实生活中的问题。当前有三个因素推动着人工智能的发展:一是大数据和知识;二是人工智能的模型和算法;三是计算能力。与此同时,大数据领域也面临三大挑战:一是大数据的数量胜过质量,数据量越大,数据质量随之下降;二是人工智能算法还无法解决人类行为中不可预测的一面,让计算机完全掌握人类的常识还比较困难,常识推理能力还很欠缺;三是大数据的运算面临功耗大的问题。
清华校友、百融金服CEO 张韶峰
清华校友、百融金服CEO张韶峰介绍了AI、大数据在金融行业智能风控领域的应用。他表示,当前,中国普惠金融面临的市场痛点在于,一方面小微企业和个人在信用卡、信贷、保险业务上有较大需求;另一方面,金融机构很难甄别好坏客户,缺乏科学风控手段,现有技术手段又很难通过线上渠道触达并获取客户。而利用大数据和人工智能技术,可以帮助小微企业和个人架起普惠金融供需双方的桥梁。因此,科技手段是破解普惠金融的唯一可选性。
清华大学自动化系教授 张长水
清华大学自动化系教授张长水介绍了当前机器学习和图像识别的研究现状,他认为,虽然图像识别在现实生活中有了比较成熟的应用,但仍有很多问题有待解决。比如说,图像数据量小、样本获取困难、样本标注成本高、大数据量的计算、图像识别系统受到攻击、机器学习的泛化问题等。在诸如医疗、金融行业,图像识别的错误会导致严重的后果。因此,我们应该认识到图像识别有风险,相关的产品设计也存在风险。我们要做到未雨绸缪,在设计产品时考虑到可能的技术风险,而相关的学术研究也非常有必要。
在下午的分论坛现场,嘉宾们围绕大数据、人工智能及其应用展开了演讲。在分论坛一“自然语言处理及计算机视觉”的技术专场中,清华大学计算机系教授李涓子从研究背景、平台功能、核心技术及应用领域四个方面阐释了科技情报大数据挖掘与智能服务平台AMiner的研究情况。
清华大学计算机系教授 李涓子
李涓子教授认为,科技信息资源是科技创新的物质基础,从海量科技文献中挖掘新知识的产生、传播和产业化的深层规律,可以提升科技生产力。李教授团队研究开发的AMiner,是以海量学术论文为基础,自动从公开网络抽取学者信息,建立学者档案及关系网络,以学者和知识为中心的科技情报分析挖掘服务平台。这一平台可以实现全球学者分布地图、学者关系网络、技术发展趋势分析、技术热点及关系分析、数据开放及功能开放等功能,目前服务于全球约220个国家的科研人员,与科研管理部门、电信互联网企业和学术期刊有密切合作。
清华大学电子系副教授、深鉴科技联合创始人 汪玉
清华大学电子系副教授、深鉴科技联合创始人汪玉介绍了深鉴科技在深度学习处理器方面的研究成果。目前,深鉴科技致力于为深度学习提供更便捷、更高效、更经济的深度学习平台解决方案,可灵活扩展于服务器端与嵌入。自主研发的深度压缩技术和神经网络架构在人工智能领域有着广泛而深入的影响。汪玉介绍说,公司的核心技术平台分为三部分,一是深度压缩技术和 DNNDK,二是处理器指令集,三是Aristotle /Descarts DPU。其技术优势在于让算法模型更小,延迟更短、功耗更少,为深度学习提供端到端的软硬件结合解决方案。深度学习处理器可以赋能各大产业,包括视频监控、数据中心和自动/辅助驾驶。而公司首款深度学习专用芯片“听涛”也即将在今年第三季度正式面世。
清华校友、地平线联合创始人黄畅
清华校友、地平线联合创始人黄畅做了题为《针对自动驾驶的边缘计算:从算法到处理器》主题演讲。黄畅介绍说,地平线致力于提供高性能、低功耗、低成本、完整开放的嵌入式人工智能解决方案。面向智能驾驶、智能城市和智能商业等应用场景,为多种终端设备装上人工智能“大脑”。
他引用天才计算机大师Alan Kay的名言“如果你对于软件非常重视,你应该做自己的硬件;预测未来的最好方式是去创造它”来解释公司自主开发芯片的初衷。他说,目前没有发现一种可以满足公司需求的芯片,因此公司选择主动创造未来,从而降低成本和功耗,提高运行效率。演讲中黄畅介绍了公司开发的三代芯片Gauss Architecture、Bernoulli Architecture和Bayes Architecture的能力提升路径,从最初的感知定位,到语义三维环境建模,再到预测、决策和规划。
清华校友、透彻影像联合创始人 王书浩
清华校友、透彻影像联合创始人王书浩详细介绍了应用AI和系统工程开展病理影像辅助诊断的工作流程。他介绍说,病理被称为医学上的“金标准”,病理图像报告对病人的疾病诊断、最终治疗方案的制定起着非常重要的作用。然而,目前中国的病理科医生非常缺乏,有诊断资格的病理科医生只有一万人,并且一个有资格进行病理诊断的医生培训周期就长达十年之久。人工智能的发展可以实现数字病理的革命性突破,大大减轻医生的工作量,提升工作成效。
目前公司研发的技术可以为医生提供方便的数据标注工具,医生利用平板电脑和触控笔就可以对病理图像进行标注,智能系统同时可以为医生提供辅助标注,最终由医生进行审核。在获得大量标注数据后,就要对数据进行建模。具体包括,对数据进行预处理,过滤无效区域,对有效区域进行切分;然后将有效切块对应的标注作为训练标签提取出来;再对病理图像进行翻转、旋转、随机放缩等操作,最后将数据放入Tensorflow进行模型训练。
清华大学计算机系副教授 刘知远
清华大学计算机系副教授刘知远介绍了知识表示学习机器及其应用的相关知识。目前,搜索引擎大规模应用知识图谱技术为用户提供更好的服务,然而用传统的符号方式进行知识图谱的表示已经无法满足用户需求。分布式表示的方式可以将对象表示成稠密、实值、低维向量,其优势在于,可以解决大数据处理的数据稀疏问题;实现跨领域、跨对象的知识迁移;提供多任务学习的统一底层表示。刘知远副教认为,未来利用表示学习技术可以将知识图谱用于相关领域,信息检索和推荐系统,以及金融、医疗、法律领域。利用表示学习技术还可以改进知识获
取能力,具体包括富语境信息抽取、开放关系抽取和开放事件抽取。
本次高峰论坛由清华-青岛数据科学研究院主办、清数大数据产业联盟协办。当天下午同时开展了分论坛二“语音处理与数据安全”、分论坛三“交通大数据与医疗大数据”、分论坛四“金融大数据与司法大数据”等学术讨论活动。(秋水)
关注智能公众号(smartman163),为你解读AI领域大公司大事件,新观点新应用。