《社会统计分析与数据处理技术(Stata)3-数据的读入与熟悉课件.ppt》由会员分享,可在线阅读,更多相关《社会统计分析与数据处理技术(Stata)3-数据的读入与熟悉课件.ppt(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章描述数据的读入与熟悉描述数据的读入与熟悉本章主要内容3.1log(记录)命令及其用途3.2数据的记忆(存储)空间(memory)3.3数据的读入3.4数据的保存(save)3.5数据的类型与压缩(compress)3.6数据的熟悉3.1log(记录)命令及其用途Log文件的用途Stata所有的运行结果都可以被记录在Log文件中。文件类型通常以后缀.log表示若在对数据进行操作处理前创建一个log文件并指定其路径和文件名、在运行结束时关闭该文件,则log将记录Stata运行期间的全部结果,包括(1)执行过的所有命令、(2)运行过的一切步骤、(3)全部描述或分析结果、(4)错误提示等log文
2、件对回顾分析思路、发现和认识错误等都很有帮助该文件可在处理或分析数据时随时创建和使用.logusingE:stataChapter3.smcllog:E:stataChapter3.smcllogtype:smclopenedon:13Feb2007,09:27:14Chapter3是log文件名;smcl(StataMarkupandControlLanguage)为log文件存盘的默认格式。Chapter3.smcl将记录从logusing命令到关闭该文件期间Stata的所有运行结果这类文件仅能通过Stata软件被阅读和打印,不能被编辑、修改Log文件也可以被存为文本文件(.txt)。其命
3、令是:.logusing文件路径.log此外,还可利用Translate功能,将smcl文件转换成文本文件暂时关闭、重新打开、关闭log文件.logoff暂停纪录文件的基本命令.logon重新开始记录文件的基本命令,接着前面暂停的地方继续记录.logclose关闭记录文件的命令。当退出Stata时,使用logclose命令关闭log文件。补充或取代现存log文件对现存的log文件,Stata提供三种处理选择:1.Viewexistingfile(readonly)(查看只读的log文件)2.Appendtoexistingfile(在原文件上附加新的log内容,即append)3.Overwr
4、iteexistingfile(替代原有log,即replace)。使用append命令将新内容附加到原文件:.logusing“E:stataChapter3.smcl,append选项append将在原有文件的基础上添加新内容使用replace命令取代原文件:.logusing“E:stataChapter3.smcl”,replace选项replace将取代原纪录文件3.2.数据的记忆(存储)空间(memory)记忆空间当数据读入后,Stata将该数据临时存放在一个叫记忆(存储)空间的地方记忆空间是Stata的临时工作环境。数据文件只有在读入该空间后才能被处理。在某一个时点上,记忆空间中
5、最多只能有一个数据文件若在处理一个数据文件的过程中想查看或处理另一个数据文件,必须先用clear命令,清空记忆空间后再打开下一个数据文件与记忆空间有关的命令主要有两个:.setmem.clear记忆空间不足的错误清空记忆空间(clear)在同一个时点上,记忆空间中最多只能有一个数据文件当Stata的窗口已经有数据运行、但需要读入另一个数据时,需要清空memory中的数据。其命令为:.clear既可在读入新数据前输入上述命令,也可以在读入数据的过程中附上该命令前者需要两个命令:.clear.use文件路径和名称后者只需要一个命令:.use文件路径和名称,clear3.3数据的读入方法一:在do-
6、file文件中输入数据input ProvincePersonIDHomeSizeAgeGirlSiblings21 21060185045051135 3505154103100180032 320509370324680037 37081562036090045 44520824042061335 350111730525131245 452605760690101332 32091639032520037 37020933046870137 3704057503802003end方法二:直接将数据粘贴到DataEditor现存数据的读入Stata可以直接读入下列尾缀形式的数据:.dtaS
7、tata数据形式;.txtASCII(文本)形式.rawASCII(文本)形式.xlsEXCEL形式使用不同的命令读入不同格式的数据。读入数据的主要命令包括:.insheet.infile.infix.dta数据的读入(I).dta数据为Stata数据,可直接读入:直接使用Windows的“OPEN”图标使用下列命令读入文件:.use “I:statachapter3.dta”“I:statachapter3.dta”:读入数据的基本命令:文件路径和名称.dta数据的读入(II)读入文件中的部分变量.use变量变量using 文件名 :需要读入的变量名称:读入部分变量和观察值时的命令,需与us
8、e连用.use age sex height weight using文件名读入文件中的部分观察量.use文件名in X/Y :限定观察值的基本命令:具体的观察值.use I:statachapter3.dtain 601/1000 软件只读入从第601个观察到第1000个观察之间的400个观察量ASCII(文本)数据的读入 三种不同的命令,分别用于不同的数据类型:三种不同的命令,分别用于不同的数据类型:.insheet.infile.infix3.4数据的保存(save)3.5数据的类型与压缩(compress)数据的保存使用窗口工具栏中的Save图标或File菜单中的Save选项.save文件路径和名称 :保存文件的基本命令 若同名文件已经存在,则需添加replace选项:.save文件路径和名称,replace :取代原有数据;选项与命令之间须用逗号隔开注意:replace选项将更新数据库,若希望保持原数据,最好使用不同的数据名称数据转换前后的类型3.6数据库的描述描述、管理数据的基本命令描述数据库排序变量