尖峰对话 CIO与服务商共话大数据
【比特资讯】以“大掌控 大智汇 大 洞察”为主题的 微软 大数据解决 方案媒体沟通会在京召开。 会议上来自微软高管与国内数十家媒体分享了微软在大数据领域的最新研究成果、解决方案,以及对于大数据未来趋势的专业洞察。 来自微软大中华区 首席云计算战略官、微软大中华区副总裁兼市场战略部总经理谢恩伟、上海复旦大学附属中山医院信息中心主任阴忆青、 中国银行股份有限公司信息中心助理总监袁俊德,福建高速公路有限公司监控中心主任王辉等知名 企业 CIO、服务商代表共同就大数据热点话题进行了探讨。以下是大数据节选:
阴忆青:我是来自上海复旦大学附属中山医院,我个人是学临床出身的,没有任何的技术背景,所以如果今天说错什么的话,请大家多指正。
谢恩伟:从技术这个领域来说,更多的是怎样能够支撑起广大用户的应用场景。
袁俊德:我来自于中国银行总行信息中心,主要是负责中国银行在全球所有的金融业务系统的运行。我是技术出身,典型的IT男。非常高兴能够参加这个活动。
王辉:非常高兴参加这个活动,我叫王辉,来自福建高速公路,我们的总指挥部和公司是两块牌子、一套人马。我的工作是负责福建省高速公路机电 信息化建设和运营工作,我学的专业是通讯工程。
谢恩伟:我们刚刚过完十一黄金周,我是躲到上海,一件事情都没做,就在我爸妈家吃、休息、跟朋友见面。后来看到很多 微博、微信上说到了交通堵塞等等方面的一些问题,我这里有两个数据很有代表性,1.76亿辆次的高速出口小客车流量在十一黄金周,比去年增长10.2%。我想先听听王主任的一些想法,大数据这个方面在交通领域有什么最新的应用和进展?
王辉:非常高兴能给大家介绍一下。我简单介绍一下福建高速,我用三个数据来介绍福建高速公路,投资总额2600亿,已经完成了,到年底可能接近3000亿。第二个数据,通车里程现在是3600,到年底是通车4000公里的高速公路。第三个数据是流量数据,福建省高速公里的里程和规模在全国是中流,基本上是排在中间的位置,今年10月1日,我很不幸,每个节假日都不能休息,要在指挥中心值班,那天我们突破了200万的车流量。上个星期我还在交通部活动,跟几个省市一起开会研究节假日情况的时候,最高的应该是广东、江苏、北京这一带,其中江苏省已经突破一天400万辆。
谢恩伟:在交通方面,特别是在数据这个领域当中,现在已有的应用有什么样的进展?
王辉:我正好是交通运输部路网标准组的成员,我一直在参与国家在公路网管理的这项工作。从国家层面来讲,去年国家在交通部下面成立了一个路网监测与运行处置中心,这个是过去没有过的,因为过去交通部管建设,不管运营,现在他已经管运营了,跟铁路、民航一样,开始全面运营。省里面也同样,在省交通运输厅,每个省等成立相应的机构,因为我们有三大重要的工作:第一,路网的日常管理,包括收费,收费也是我们很重要的工作,我们每一年的收费额大概是110亿,每年都以百分之十几在增长;第二,目前还有一项重要的工作,就是应急处置,因为高速公路10万公里已经通车了,现在社会关于通行安全这块的要求非常高,所以我们有应急处置系统,不管是国道、城市道路,当有情况的时候,必须快速的进行处置、救援,这里面有生命的救援,也有道路畅通的救援;第三是服务,国家这个层面上,包括我们省里面,已经把为领导服务转为为社会服务,因为老百姓要出行,他必须要快捷、便利、安全,这是他们的基本要求,我们在这块做得还是很不够的。刚才主持人说到,我们采取了什么措施,应该这么说,在道路管理上,你们每次出行都有一个强大的后勤队伍在为你们服务,就是基本的服务和救援,当然我们做得还不是很够。
说到大数据,不管是高速公路还是普通公路沿线,开始逐步为满足高速公路或普通公路的运行,在投入大量的资金,来做一些传感器,来收集道路的状态,收集出行的信息。这些信息干什么?这就是大数据的来源,最后经过一定的处理,来提供给我们的人员。目前的手段也还不是很好,刚才一个专家在说,他是用出租车 GPS,GPS是很重要的一个数据,我们也在用,但是它有限,只是装了GPS的运营车辆才有,但是它占的比例还不到5%,很小。更重要的是我们需要了解所有车的运行情况,否则我们不进行日常的控制,应急突发事件的救援就无从谈起。全国都是类似的情况,城市道路可以建得好一点。高速公路面积很大,要想控制得很好,依然是一个挑战。
谢恩伟:从福建高速的角度来说,他收集的数据是非常庞大的,也有不同类型的数据,有的数据是拍照片的影像数据,有些数据是从GPS得到的地理位置数据。在这些数据当中,为将来的交通管理也会带来很大的益处。从2012年开始,微软已经跟福建高速,特别是在SQL 2012年上面已经有了进一步的合作,我们也非常期待在这个方面能做更多的动作,从分析、演示、视觉化、决策等方面,都能够帮助福建高速有更多的成绩。
谈完交通,要谈一下另外一个跟国计民生非常有关系的行业,那就是医疗行业。今天碰到一个上海老乡,我们在台下还在聊上海话。阴主任,能不能跟我们说一下,大数据在中山医院,您那边有什么样的应用、设想和实践。
阴忆青:不管是银行还是高速公路,我们IT起步相对晚一些,上世纪90年代才刚刚起步。最近几年真的是飞速发展,这是有赖于国家政策的推动,取得了非常好的成绩。
从具体业务来看,我们既有传统的存在Excel的数据,当然也不能用Excel来判断是不是结构化,我看到现在有人用Excel来画图,有人用它来做装修计划,所以真的是无所不能。在我们院里面是有结构化的数据,像大家门诊的挂号数据,还有我们的医嘱,这些数据现在越来越多的被放到信息系统里面,刚开始的时候,我们都是从收费开始,后来就关系到业务,再后来关系到一些临床的数据,也开始出现在这里面了。还有一些我们认为非结构化的数据,或者叫影像的数据,这个在体积上是比较大的,我们原来有单幅的像胸片的图像,后来有了CT和磁共振的图像,这些数据越来越大。最近我们又尝试去扫描一张病理切片的图像,平均一张病理切片,如果我们去扫描的话,一张就是1G。但是这1G的数据,你是很难去做快速分析的。就像刚刚大家听到总裁说的,海水很多,但是并不是你舀起一口就能喝,你要做很多模式的判断,然后对模式进行分析。
中山医院在上海也是一家中等规模的医院,我们一年大概平均有300万左右的门急诊人次,有8万左右的出院人次,每年接近6万次的手术数,这个量听上去好像比较多,但是在上海可能有30多家像我们这样大小的医院。在全国而言,我们只能算是一个中等偏小规模的医院。现在全国最大规模的医院在河南,因为河南是人口大省,单体医院超过7000张床位。所以从医院的数据来说,业务量大,它的数据量必然也大,还有就是不是相同的医院,我们会把它联系起来,上海申康推进了医联的项目,在上海38家三级甲等医院,也就是目前中国级别最高的医院,我们都连接在一起,38家医院里面,病人的数据可以互相沟通,病人到另外一家去看的时候,他可以看到前一家医院上传的化验报告,你用了哪些药,甚至你检查的影像数据。所以从医联系统来说,累计了非常大量的数据,这些都能为我们以后的分析提供非常好的基础。所以医疗在现阶段是一个打基础的阶段,需要后续持续的投入来做一些分析。
谢恩伟:这对我来说真的是一个福音。我在2006年的时候,正好那年春节我在海外,回来之后我爸告诉我,我外婆住院了,他跟我解释了一下整个住院的过程,从她挂号,从急诊到复诊,都是有很欠缺的数据的连接。比如她在急诊上做了一个验血的报告,在复诊的时候不能再采用,还要重新再做一次,她以前拍的照,在不同的部门要重新再做一次,这样是一种信息的断层,在七年以前看得非常清楚。这对我来说是一个非常重要的改进,在将来这样一个时间点,能够把这些数据串在一起,怎样能够挖掘更深的价值。
阴忆青:现在这个问题已经基本上解决了,临床医生可以看到历次的就诊数据。临床医生会根据专业的标准去判断这些数据是不是仍然有价值。举例来讲,可能那时候的验血报告我们认为时过境迁,病人的状态改变了,我们需要重新再去做,但是至少我们能够看到,然后能够判断。
谢恩伟:我也非常期待能够通过微软的技术,在中山医院当中有更多的突破。刚刚讲了交通和民生,让我们的技术男谈一下,特别是在银行这个领域当中,实际上我们跟中国银行合作蛮长了,我也想听一下中国银行现在大数据应用的状态。
袁俊德:如果说应用计算机,从国内来看最早的是国防行业,下一个可能就是金融行业。刚才谢总讲我们跟微软也是合作很长的时间。
中国银行作为国内国际化程度最高的一家银行,从一开始我们跟微软的合作就是一直是正版,我们从来没有用过盗版。所以作为微软相关产品的应用,我们也是有一个逐步的过程。银行这个行业IT的应用可以算是企业级的应用,微软最早从我们这儿的应用是从办公做起来的,就像Office相关的这种软件。随着微软在企业应用方面的一些发展,我们在核心银行的领域,特别是在前端领域,有了非常大的应用。包括我们现在核心银行系统所有前置的系统,目前采用的都是微软的基础环境在做。后期我们在营销分析这些方面,也是采用了微软的解决方案,比如我们全球的统一客户经理的平台,现在也是在做。
从应用的范围上来看,从一开始的办公,到我们的企业级应用,到刚才讲的全球客户经理平台,跟我们的大数据应用有很 密切的关系。作为银行来讲,因为银行的数据基本上还是以结构化数据为主,所以我理解,大数据的概念和数据仓库的概念还是不太一样的,因为它更体现在数据的多元化,以及如何高速的对这些多元化的数据进行检索,以及如何把检索出来的数据通过分析加以使用,我理解这是跟大数据相关的一些内容。