《使用python抓取及分析互联网数据.pptx》由会员分享,可在线阅读,更多相关《使用python抓取及分析互联网数据.pptx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、使用python抓取及分析互联网数据计算士介绍:集智俱乐部,英文名:SwarmAgentsClub,简称“SAClub”,成立于2008年,是一个从事学术研究、享受科学乐趣的探索者的团体。它倡导以平等开放的态度、科学实证的精神,进行跨学科的研究与交流,力图搭建一个中国的“没有围墙的研究所”我们的口号:让苹果砸得更猛烈些吧!我们的使命:营造自由交流学术思想的小生境,孕育开创性的科学发现网址:豆瓣小站:活动地点:叁号会所(北京市海淀区北三环联想桥向西300米过街天桥中航工业青云大厦)集核成员:Jake,Miner,果蝇小姐,老何,王东,xudong,sendlee1.Scrapingandanal
2、yzingwebpages:collectingwebsitestatisticsfromGoogleandAlexa2.ConnectingAPIs:GoogleAPI,YouTubeDataAPI,TwitterAPI,andAlchemyAPI3.Browserautomation:collectingthehistoricalviewingrecordsofYouTubevideos非常不方便的原始工作环境建议使用一个可以实时测试代码片段的工作平台任务:从Alexa上抓取美国排名前25的网站,并获得这些网站彼此之间的点击流步骤:1.分析网页 2.写代码 3.测试网页分析工具:Chrom
3、e自带的鼠标右键Inspectelement选项或者Firefox的firebug插件1.Scrapingandanalyzingwebpages:collectingwebsitestatisticsfromGoogleandAlexa2.ConnectingAPIs:GoogleAPI,YouTubeDataAPI,TwitterAPI,andAlchemyAPI3.Browserautomation:collectingthehistoricalviewingrecordsofYouTubevideos任务:使用AlchemyAPI侦测网站的语言YouTubeDataAPI:已经提供好p
4、ython接口1.Scrapingandanalyzingwebpages:collectingwebsitestatisticsfromGoogleandAlexa2.ConnectingAPIs:GoogleAPI,YouTubeDataAPI,TwitterAPI,andAlchemyAPI3.Browserautomation:collectingthehistoricalviewingrecordsofYouTubevideosInsightdata:历史浏览记录。分析网页结构后发现,是被触发后服务器发出的一串100个数字,发送到GoogleGraphicAPI形成图片对策:模拟浏览器来触发并获得数据调用浏览器点击按钮等候服务器发送数据保存数据并退出浏览器剩下的事情就非常简单了谢谢参与