这个理论上只要有完整书籍的索引页面就可以爬到。
当然需要有合适的访问权限。
任何一种爬站其实就是从某个页面开始分析链接规则,进行过滤爬取(去重,爬取满足一定规则)
理论上是可行的,但是你要爬的网站要没的设置反爬虫的措施才可以的。
有一些网站是可以设置反爬虫的
还有,你的书是什么形式的呢,现在有一些书都是图片的 ,你爬下来也是图片的,而不是文字的