文章作者│李涛(医院管理教授)
说到分析工具的选择,很容易陷入推销产品的嫌疑,为此,我站在一个具有二十年多国内外医疗数据分析经验的客观角度上来客观评价各种分析工具的优势和劣势,以便给大家一个公正的建议。数据分析类工具大体可以分为以下五类:
▶Excel生态工具:Excel、VBA、PowerQuery、PowerPivot、Power View、Power Map
▶BI工具:PowerBI、Tableau、Qlikview、SAP BI、Oracel BI、FineBI、Yonghong BI
▶数理统计工具:SAS、SPSS、Stata、Minitab、Eviews、Statistica、MATLAB、Mathematica
▶数据库工具:MS Access、MySQL、PostgreSQL、Oracle、SQLServer、MongoDB、Hive
▶编程工具:Python、R、Julia、Scala、Spark、Java、Hadoop
由于职能部门很少接触后三类分析工具,我们就不再讨论,重点说说Excel和BI。
① Excel
几乎是人人都在用的数据处理软件,由微软开发,是office三剑客之一。毫无疑问,Office是当今工具领域的挣钱王者,每年都给微软带来上百亿美元的收入。国内对标的软件是WPS的表格,功能大体相似。
虽然Excel很容易入手,但大部分人对Excel的使用程度还处在入门阶段,存取数据、做做表格。其实Excel可以用来做数据处理,制作复杂的报表、建立数据分析模型等应用。Excel里的编程语言,通俗理解为“宏”,可以实现自定义的需求、自动化和批量化地操作Excel。
优势:Excel在对小样本数据(10万行200个字段之内)的处理能力还是非常不错的,尤其在学通了Word和数据库MS Access之后,可以形成三者之间的相互调用,加上“宏”的自动化执行,基本也能满足实现自动化的报告和报表的需求。
劣势:一旦数据量偏大,Excel的短板立马就变得非常明显,不但处理速度下降,而且还常常导致系统死机,重启后也容易丢失数据。另外一个短板就是需要掌握VBA的编程语言,才能实现调用过程中的各种功能(Function/Sub)的灵活操作,这对于没有编程基础的业务部门人员来说是一个巨大的拦路虎。
② BI
BI又称商务智能(business Intelligence),起源于上世纪50年代,后在1996年由Gartner明确定义出来。BI通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的可视化工具,是大部分数据分析岗位需要用到的工具。目前国际上最流行的BI软件是Power BI(微软)和Tableau,国内对标的是Fine BI。
优势:由于可以直连不同的数据库,加上强大的数据处理,下钻分析、允许数据混合和实时协作等功能,BI已经广泛地被企业,学术研究人员和许多政府用来进行动态视觉的数据分析。实时数据的更新、直观感强、下钻功能强大等都是BI在数据分析中非常明显的优势。另外,BI的学习成本也很低,实现无代码的编程,人人都能够很快学会在前台的“拖拉拽”,后台却是又复杂的程序来控制。
劣势:凡事都有好坏两个方面,由于直连数据库的原因,存在数据库被破坏的风险,为了安全起见,很多企业都是先由信息科先对原始数据进行处理,然后再分发给业务部门。然而,由于业务部门的人员并不了解预处理过程,不加思索地直接采用系统中的平均值功能,造成平均值的平均等错误结论的情况很普遍。此外,BI的文本功能非常弱,不适合用来制作分析报告,也是其明显的短板之一。
了解“医院运营数据分析实战训练营”信息→微信公众号