【Pre-Sufer精彩回顾】明星教师公开课第一讲之徐国祥教授

       328日,Pre-Sufer校园初体验之明星教师公开课正式开课。上财商学院第二届“MBA杰出教学奖”(明星教师)获奖者徐国祥博士为各位考生及MBA在读学生带来了题为《化繁为简——大数据时代的社会经济和金融数据分析》的课程。

       课程主要从大数据研究背景、大数据四大核心思维、大数据应用实践与新思路、大数据统计化应用探索、大数据在资本市场的应用案例以及大数据在社会经济领域的应用案例这六个方面展开。徐老师将理论分析与实践应用案例相结合,并对大数据的应用探索提出了自己的独特观点,为同学们架构起了大数据分析的完整知识体系。

徐国祥老师授课现场

同学们认真听讲

 

       在精彩的明星教师公开课之后,上财商学院MBA中心招生办公室的冯达老师向各位考生详细介绍了上财MBA项目,并针对考生提出的问题一一进行了解答。

 

以下是明星教师公开课第一讲的干货分享:

☆大数据现象的起源与发展

l  萌芽阶段(20世纪80-90年代中期):“大数据”词汇零散分布在报告或新闻中

l  关注阶段(20世纪90年代中期-本世纪前10年):开始审视“大数据”潜在价值

l  发展阶段(2010年后):商业价值得到深入挖掘;主要国家政府制定大数据战略

l  大数据的特点可以用“4V”来概括:体量巨大、种类繁多、流动速度快、价值密度低

l  大数据与传统数据的差异在于:1,大数据的数据来源更丰富,比如:新增互联网浏览记录、社交网上文本、图像、视频、音频等,并且大数据主要是个体行为的记录,更贴进微观;2,大数据与传统数据在数据采集、数据分析、数据技术方面都存在差异,这是因为传统数据源于阶段性,它的采集方法、分类、标准已定,而大数据源于过程性,即时性的行为与记录,因此并没有清晰的方法、路径和评判标准。

 

☆大数据“四大”核心思维

l  因果与相关:大数据知道“是什么”,不需要知道“为什么”(商业价值导向和认知技术不足);科学方法知道“是什么”,更需要了解“为什么”,未来,大数据将逐步向科学方法转变。

l  混乱与精确:为避免大数据的“混乱”,可适当提高容错标准,把大数据纳入统计应用,并通过数据量增加弥补个体数据错误,提升总体数据精确性。

l  样本与总体:大数据具有可扩容性,能呈现更多规律,捕捉弱小信息,覆盖异常情况。

l  数据与方法:数据密集型科学的分析流程为:“定性-定量-再定性”变为“定量-定性”。

 

☆大数据分析时应注意的问题

l  大数据的“大”有多种含义:一是“全体”的意思,即大数据就是全体数据,并且数据量必须达到一定的规模。二是“可扩充”的意思,即大数据就是可以不断扩充容量的数据,任何数据一旦发生就可以被记录、被吸收。三是“有待挖掘”的意思,即大数据就是有待挖掘的数据。数据就是信息,信息就有价值,但容易发现的信息通常没有什么价值,而具有价值的信息通常难以被轻易发现。显然,大数据可能包含着丰富的、具有大价值的信息,但被超大量的数据所掩盖、所分散而导致价值密度低,只有挖掘才能发现。

l  大数据中的“数据”可以进行多个角度的分类:如果从大数据产生的途径或渠道来看,大数据可以分为社交网络数据、人机交换数据和感应数据(机器数据)。如果从功能上看,大数据可以分为交易型数据、流程型数据和交互型数据。

l  大数据不一定是好数据:首先,大数据不会自动产生好的分析结果,不会自动把隐藏其中的秘密呈现出来,如果数据不完整、取舍不当或遭受破坏,那么就会产生错误的结论。其次,大数据是动态的,具有阶段性特征,同样的关联词在不同时段可能具有不同的含义,围绕关联词的话题会随着时间的推移而会发生某些偏离,从而导致有偏的结论。第三,对于我们所关心的研究主题,可能会受到大量没有实际意义、实际内容甚至虚假信息的干扰,让我们面对一堆数据无从下手,大数据变成了大迷惑,甚至变成了大错误。第四,大数据中有很多小数据问题,这些问题并不会随着数据的增加而消失,反而可能更严重。