项目日记 - 开发图片爬虫 Ⅲ

用C++开发一个图片爬虫 Ⅲ :URL预处理 【咕咕】
封面图片来自网络,如有侵权将删除。

前言

上一节说这节介绍WinHTTP,现在好像鸽子了。经过我再三思考后,还是先深入学习WinInet吧。

关于根据链接下载网页的各种方式在第一节已经介绍过了。这里再补充一下,还有一种方式是使用外部库libcurl,使用方便代码简洁,但我不把它当做我们主要学习的对象,因为它太过于简单。

这节可以说是个扩展篇,并不是这个项目优先考虑的内容。先介绍它主要是因为这部分东西更有意思,大家可能会更感兴趣。

项目日记 - 开发图片爬虫 Ⅱ

用C++开发一个图片爬虫 Ⅱ :编码转换

前言

我们上一节学习了获取网页的代码,那么大家可能会以为接下来就是分析网页了。但事实上,我们还需要先转换编码。我们都知道,C++编程常用的是ASCII编码,而网页大部分使用的是UTF-8编码。

因此我们要先将获取后的网页转换成我们想要的编码,再去分析内容。

项目日记 - 开发图片爬虫 Ⅰ

用C++开发一个图片爬虫 Ⅰ :获取网页内容

前言

这个项目很久前就开始写了,但一直没有很完善。最近想起来,打算重新完善这个项目。

本教程仅适用于C++。内容较为复杂,可以根据自己需要来阅读。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×