会员注册 / 会员登陆  
   
         
 
马列主义、毛泽东思想、邓小平理论
哲学、宗教
社会科学总论
政治、法律
经济
文化、科学、教育、体育
语言、文字
文学
艺术
历史、地理
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
自动化技术、计算机技术
化学工业
建筑科学
水利工程
交通运输
航空、航天
环境科学、安全科学
综合性图书
军事
 
中国最美的100个地方
痰湿一去百病消
五号屠场
兄弟
习近平谈治国理政
借势
大话中国艺术史
面纱
百年孤独
人生海海
圆圈正义
法治的细节
杀死一只知更鸟
被讨厌的勇气
画给孩子的中国历史
类图书 详细说明
 
书 名: 基于python的web大数据爬取实战指南
作 者: 夏换,杨秀璋,于小民编著
出版社: 科学出版社
出版日期: 2019.3
ISBN: 9787030606372
分类号: TP311.561
尺寸:
定 价: 82元

详细说明:


本书主要是基于Python的Web大数据爬取实战指南,选题内容包括基础知识和通过Python爬取Web网页数据两大部分。下图是PythonWeb数据采集的结构图,主要包括三个部分:网络传播技术、信息提取技术和数据存储技术。网络传播通常是使用HTTP进行,常用的传播方式包括HTML、XML、Json、Ajax和纯文本等;信息提取技术主要可以通过Python语言、R语言、Java语言等进行获取,其中主要包括的技术包括:正则表达式、XPath技术、Selenium、BeautifulSoup等;数据存储技术主要是存储爬取的数据信息,主要包括SQL数据库、纯文本格式等。


【 返回上页 】