热门标签
标签: 爬虫
以下是与 "爬虫" 标签相关的所有文章。
- Robots排除协议,它是网站管理者表达是否希望爬虫自动获取网站信息意愿的方法。
- 在网络爬虫的爬行策略中,应用最为基础的是()。
- (),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。
- ()的爬虫针对的是网页上的数据,所抓取的数据一般要符合一定的模式,或者可以转化或映射为目标数据模式。
- 深层网络爬虫的基于网页结构分析的表单填写法一般将网页表单表示成(),从中提取表单各字段值。
- 增量式爬虫中的()指的是:爬虫以相同的频率访问所有网页,不考虑网页的改变频率。
- 以下关于网络爬虫的说法,不正确的是()。
- DeepWeb爬虫体系结构中的LVS用于()。
- DeepWeb爬虫体系结构包含六个基本功能模块和两个爬虫内部数据结构,其中()表示标签数值集合,用来表示填充表单的数据源。
- ()又称全网爬虫,爬行对象从一些种子URL扩充到整个Web,主要为门户站点搜索引擎和大型Web服务提供商采集数据。
- 上一页
- 1
- 下一页