项目日记 - 开发图片爬虫 Ⅲ

用C++开发一个图片爬虫 Ⅲ ：URL预处理【咕咕】
封面图片来自网络，如有侵权将删除。

上一节说这节介绍WinHTTP，现在好像鸽子了。经过我再三思考后，还是先深入学习WinInet吧。

关于根据链接下载网页的各种方式在第一节已经介绍过了。这里再补充一下，还有一种方式是使用外部库libcurl，使用方便代码简洁，但我不把它当做我们主要学习的对象，因为它太过于简单。

这节可以说是个扩展篇，并不是这个项目优先考虑的内容。先介绍它主要是因为这部分东西更有意思，大家可能会更感兴趣。

2019-05-28

项目

13 分钟读完 (大约 1976 个字)

项目日记 - 开发图片爬虫 Ⅱ

用C++开发一个图片爬虫 Ⅱ ：编码转换

我们上一节学习了获取网页的代码，那么大家可能会以为接下来就是分析网页了。但事实上，我们还需要先转换编码。我们都知道，C++编程常用的是ASCII编码，而网页大部分使用的是UTF-8编码。

因此我们要先将获取后的网页转换成我们想要的编码，再去分析内容。

2019-05-26

项目

25 分钟读完 (大约 3746 个字)

用C++开发一个图片爬虫 Ⅰ ：获取网页内容

这个项目很久前就开始写了，但一直没有很完善。最近想起来，打算重新完善这个项目。

本教程仅适用于C++。内容较为复杂，可以根据自己需要来阅读。