《从数据库到数据科学的教学法探讨.docx》由会员分享,可在线阅读,更多相关《从数据库到数据科学的教学法探讨.docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、从数据库到数据科学的教学法探讨摘要:计算机是人类历史上最重要的技术发明之一,它的出现深刻的影响了社会的发展,为各行各业带来了深远的技术革命。作为计算机科学中最重要的基础分支,数据库一直以来都受到学术界和工业界的重视。然而,对于高校计算机本科及低年级研究生而言,数据库方面的授课内容及教学方法大多数还局限于七、八十年代的数据库基础理论和略显陈旧的技术,教学方法也过于单一,这不利于培养和选拨能够紧跟信息时代技术发展的人才。针对这些不足,本文参考了国际上知名高校和科研机构在数据库和数据科学领域最新的教学和科研动向,提出从基础层面到应用层面的教学法,尝试将最新的数据科学知识框架引入到传统的数据库课程。通
2、过在相关课程上进行的教学实践,作者發现学生能够更深刻的理解和掌握传统数据库的相关理论,并对前沿的数据科学领域也有了全面的了解,极大的提高了学生的学习主动性和对科研的兴趣。关键词:计算机科学;数据科学;数据管理;教学方法;教学质量;【中图分类号】TP3-40 引言进入二十一世纪以来,随着通讯技术和信息技术的飞速发展,人们产生和收集数据的能力以几何级数的方式增长,例如,腾讯、新浪微博等每天处理的用户讯息达上亿条。如何有效的管理这些生成的海量数据并从中分析挖掘出有用的信息,是计算机学术界和工业界关注的焦点。作为计算机科学中最基础最重要的分支,传统的数据库理论和技术在近几十年来一直是管理关系型数据的最
3、有效的工具和手段。然而,伴随着各种新应用的产生,传统的数据库技术已经很难应对这些应用所产生的非关系型数据,例如,车载导航仪产生的GPS轨迹数据,微博产生的文本流数据,社交网络产生的关系图数据,等等。然而,目前高校计算机专业本科生及低年级研究生的数据库课程大多数还沿袭着传统关系数据库的理论知识框架,很少涉及最新的数据管理技术和数据科学。因此,如何将数据科学与传统数据库知识相融合,这对于帮助学生掌握最新信息技术及培养学生的创新能力将具有非常重要的意义。1、目前现状数据库课程是最受学生重视,但是又没有多少兴趣和动力去学好的课程。一方面,传统的数据库课程主要基于六、七十年代发明的关系数据模型,内容包括
4、关系代数、关系演算、SQL查询语言等。这些知识点侧重于理论,同时教学内容和应用实例相对而言也比较枯燥。另一方面,一些学生并不是因为兴趣去选择数据库课程,而是因为它是高校计算机专业的必修课之一,为了拿到学分而不得不努力应付。目前高校计算机本科生及低年级研究生的数据库课程相对国外而言存在着一定的差距,主要体现在以下几点。首先,相关的数据库教材内容相对陈旧,新知识点不多。这是因为信息技术的推陈出新速度非常快,每隔一年甚至是半年,都会有大量的新应用新技术出现,而作为教材而言,更新速度远远跟不上业界的技术发展。其次,信息产业的创新源头主要集中在欧美等发达国家,并且大量的技术文献和最新的研究论文都是用英文
5、撰写。这些新技术传播到国内自然会有一定的时间差,例如,由于技术堡垒问题欧美国家的企业会对最新的计算机技术进行一段时期的保密封锁,即使获得了相关的技术文档,将这些英文文献翻译成中文也需要一定的时间。另外,国内的计算机类公司采用的数据库技术与国外相比也有一定的差距,大部分公司对计算机类毕业生的知识结构要求不是特别高,掌握传统的数据库理论和一些简单技术已经能基本达到公司的要求,所以一些高校也不太注重及时更新数据库课程的内容和知识点。目前数据库教学的现状,也说明了一个普遍的问题:如果不紧紧跟随最新的技术发展趋势,就不太可能有所创新,也不太可能做出有影响的研究成果。而对于国外高校及研究机构而言,为了适应
6、信息技术的发展,它们的教学和科研重心也开始从传统的数据库向数据科学慢慢转变。例如,在2014年美国ACM数据管理国际会议(ACM SIGMOD)上,来自世界知名高校和研究机构的几十名计算机科学家召开研讨会,商讨对数据库教学进行改革,并倡导用数据科学来代替传统的数据库课程。在短短半年时间里,很多高校,例如华盛顿大学、加州大学伯克利分校、纽约大学、佛罗里达大学等,都积极响应这一倡导,开设了针对本科生及博士生的数据科学课程,得到了广大师生的肯定和欢迎。鉴于此,本文提出了两种教学方法,尝试将数据科学这一新的知识框架引入到传统的数据库课程中,让学生对新技术产生好奇心,紧跟着国际最新技术动向并激发学生的创
7、新思维和探索精神。2、从数据库到数据科学如何有效的把学生的学习重点及兴趣从传统的数据库知识引入到数据科学领域,是一项具有挑战性的任务。经过分析国内外知名院校的计算机课程内容安排和它们的优劣,我们总结出适用于国内本科生及低年级研究生的教学法。具体而言,我们采用了两种方法,从基础层面和应用层面来对传统数据库与现代数据科学知识框架进行对比学习。2.1 基础层面为了加深学生对数据库、数据科学各种概念和模型的理解,我们提出了一种分层引入的教学方法,从两个层面对传统数据库与数据科学进行系统的对比学习。首先,根据在现实应用中各种不同的新数类型,从底层的数据组织和管理方式来阐述为什么传统数据库系统无法胜任大数
8、据时代的数据管理任务,着重指出实体关系模型(ER model)的各种不足之处。然后在此基础上,针对每种新的数据类型,我们引入相应的最新解决方案。例如,关系数据库使用“键”(key)来索引数据记录,然后在主键(Primary key)上建立B+树来提高检索效率。这种数据管理技术对于关系型数据非常有效,但是对于非关系型数据,例如文本数据和流数据,人们很难找到合适的主键来区分数据记录,并且无法利用B+树来有效的检索这类数据。特别是,对于处理大数据而言,关系数据库是无能为力的。针对这些缺点,我们引入目前学术界和工业界的最新解决方案,例如使用键值对(key-value pair)来表示数据,并采用查找时
9、间复杂度为常数的哈希表(Hash table)来进行检索。通过对比分析,让学生更深刻的理解和掌握数据管理领域最新的知识和技术。2.2 应用层面由于采用了严格的关系代数理论来保障正确性,传统数据库技术的应用面非常广泛,例如银行交易系统、交通订票系统、企业ERP系统等等。然而,为了迎合大数据时代对信息实时性和高可用性的需求,在一些应用中,比如电子地图导航和微博信息发布等,对结果的正确性可以适当的做出一些折衷。另外,随着商业竞争日益激烈化,企业决策者希望能够从海量的数据中快速的找出有用的信息,为企业的商业决策提供重要的参考依据。以上这两方面的新需求是传统的数据库技术无法解决的,而这些问题正是数据科学
10、所涉及的范畴。因此,我们需要在应用层面上具体的比较传统数据库与数据科学的优劣。首先,介绍一些生活中常见的关系数据库应用,如银行交易系统、学生选课系统等,把这些系统对结果100%的正确性要求转换成关系代数和关系演算问题,同时结合低层数据管理上所使用的技术,使得学生更深刻的理解关系数据库的长处以及它所适用的场合。然后,我们给出一些关系型数据库技术无法有效应对的例子,如GPS导航、社交网络、搜索引擎等,来说明对于用户而言信息的实时性和高可用性有时候更为重要。为达到这一目标,我们引入最新的数据管理技术,如对空间数据的R树索引、图数据的索引与查找等,并通过数学手段和算法分析来证明在一定的正确性范围内,这
11、些新技术是如何保证结果的实时性和可用性。最后,通过一些有趣的示例来强调数据科学的重要性,即如何从数据中快速、智能的找到有价值的信息,这涉及到数据挖掘(Data mining)和机器学习(Machine learning)的知识。例如,通过对超市交易数据进行关联规则(Association rule)挖掘和聚类(Clustering)分析,让学生明白如何从数据中寻找反复同时出现的有用的信息规律。通过这些分层对比学习,使得学生能够更牢固、更深刻的掌握关系数据库和数据科学的相关知识,紧跟上国外科研院所的信息技术教育发展趋势。3、教学效果与总结本文提出的教学法在高年级本科生和低年级研究生的数据库相关课
12、程中进行了实施,取得了预期的效果,也通过学生的反馈意见总结出了一些心得和经验。首先,通过对传统数据库知识及现代数据科学知识框架的学习,学生们对计算机科学及信息产业产生了深厚的兴趣,激发了他们自觉学习和勇于探索的精神。其次,在课堂中运用各种实例,从不同层面对传统数据库与数据科学进行了深入的分析对比,使得学生的分析能力和总结归纳能力得到了一定程度的提高。并且,学生们普遍反映从课堂中学到了最新的数据科学知识,既有理论知识也有实践技能,再也没有以前那种“理论与实际相脱节”的感觉。然而,在教学过程中我们也发现,需要针对不同的学生来调整授课内容及计划,因为数据科学的一些理论方面的内容相对于本科生而言偏难,
13、例如概率论和机器学习知识,而对低年级研究生来说,他们希望能够深入学习更多的理论知识。另外,在课程作业和上机实践环节,学习们普遍反映需要更多的时间,因为数据科学所涉及到的新东西较多,需要花时间来消化。因此,我们要在以后的教学中针对不同学生群体调整授课计划,同时要花更多的时间给学生进行实践指导和答疑。4、结束语在大数据时代,计算机专业的本科生和低年级研究生必须深刻的理解和掌握传统数据库技术以及最新的数据科学技术,紧紧把握数据管理技术发展的脉搏,利用所学的知识在各自的领域中作出具有开创性和影响力的工作。然而,我们在教学中也深刻的认识到,提出的教学方法也存在着一些缺点和需要改进的地方,例如,如何有效的提高学生的学习兴趣和主动性,是我们需要进一步探讨和研究的方向。参考文献:1顧红,孙光民.研究生课程教学方法改革与实践J.北京工业大学学报,2003,3(4):92-93.2刘飞.研究生课程教学改革的实践与探讨J.无锡教育学院学报,2002,22(3):48-50.