目 录
第1章 Java套接字编程技术
套接字家族
网络编程
Java I/O编程技术
代理的问题
Java中的套接字编程
客户端套接字
服务器套接字
小结
第2章 分析超文本传输协议
地址格式
使用套接字进行HTTP编程
Bot包的HTTP类组
实现细节
小结
第3章 通过HTTPS访问加密站点
HTTP与HTTPS
通过Java使用HTTPS
HTTP用户认证
**访问
实现细节
小结
第4章 解析HTML
使用HTML
Bot关心的标签
需要特殊处理的HTML
使用Bot类解析HTML
使用Swing类解析HTML
Bot包HTML解析例子
实现细节
小结
第5章 发送表单
使用表单
用于普通发送的Bot类
实现细节
小结
第6章 解释数据
CSV文件的结构
QIF文件的结构
XML文件格式
小结
第7章 探索Cookie
分析Cookie
用于Cookie处理的Bot类
实现细节
小结
第8章 编写Spider程序
网站的结构
Spider程序的结构
构造Spider程序
小结
第9章 编写大型Spider程序
多线程
用Java实现多线程
线程同步
使用数据库
高性能的Spider程序
实现细节
小结
第10章 编写Bot程序
构造典型的Bot程序
使用CatBot程序
CatBot实例
实现细节
小结
第11章 编写Aggregator程序
在线汇总与离线汇总
构造底层Bot
构造气象Aggregator程序
小结
第12章 负责任地使用Bot程序
与网站协商
Web站点管理员的措施
负责任的Spider程序
实现细节
小结
第13章 Bot程序的未来
Internet信息的传送
理解XML
传送XML数据
Bot和SOAP
小结
附录A Bot包
附录B 各种与HTTP相关的字符
附录C 故障诊断
附录D 安装Tomcat系统
附录E 在Windows下编译实例
附录F 在Unix下编译实例
附录G 重新编译Bot包
术语表