Library Search
结果页

Scrapy 爬虫从入门到反爬对抗

在 知识库 中找到 8 个匹配结果。

返回文档库
知识库

知识库

8 个
Scrapy 爬虫从入门到反爬对抗 # Scrapy 爬虫从入门到反爬对抗 ## 背景 互联网数据是新时代的石油。Scrapy 让你用几十行 Python 代码就能构建一个工业级爬虫,自动处理请求调度、重试、限速和数据存储。 --- ## 第 1 章:Scrapy 架构 ``` [Spider] → [Engine] → [Scheduler] → [Downloader] → [Spider] → [Item Pipel… 3% Hello World — 爬取图书信息 # Scrapy Hello World:爬取图书信息 ## 目标 爬取 [books.toscrape.com](http://books.toscrape.com) 上的图书标题、价格、评级,并保存为 JSON。 ## 完整代码 ### 1. 创建项目 ```bash scrapy startproject bookscraper cd bookscraper scrapy gensp… 3% Go 并发爬虫 — goroutine + channel 实战 # Go 并发爬虫 — goroutine + channel 实战 ## 目标 演示 Go 核心卖点:goroutine 轻量并发 + channel 通信。编写一个并发检查多个 URL 响应状态的工具。 ## 完整代码 ```go package main import ( "fmt" "net/http" "sync" "time" ) // URLResult 封装单个… 2% 02-进阶实战-迁移学习与部署 # PyTorch 进阶实战 —— 迁移学习、混合精度与模型部署 ## 本章目标 - 使用预训练模型进行迁移学习(Fine-tuning) - 掌握混合精度训练(AMP)加速 - 模型导出:TorchScript → ONNX - 模型量化与推理优化 ## 1. 迁移学习(Fine-tuning) ### 1.1 使用 torchvision 预训练模型 ```python import… 2% 入门教程 - 全栈 Web 应用开发 return ( <Form method="post"> <input name="title" placeholder="标题" /> {actionData?.error && <p style={{color:'red'}}>{actionData.error}</p>} <textarea name="content" placeholder=… 1% 01-从零入门教程 # PyTorch 入门教程 —— 从线性回归到神经网络 ## 本章目标 - 理解动态计算图与自动微分 - 手写梯度下降 → 使用 PyTorch 的 optimizer - 掌握 nn.Module 的模块化设计思想 - 理解损失函数与优化器的选择 ## 1. 动态计算图:为什么 PyTorch 如此灵活? **静态图(TensorFlow 1.x):** 先定义完整图 → 编译 → 运… 1% Scikit-learn 机器学习入门实战 # Scikit-learn 机器学习入门实战 ## 背景 Scikit-learn 提供了「瑞士军刀」式的机器学习工具箱。无论你是做表格数据的分类、用户分群还是异常检测,掌握它能让你在几分钟内完成从数据处理到模型评估的完整流程。 --- ## 第 1 章:理解 API 设计哲学 Scikit-learn 所有模型遵循统一接口: | 模式 | 伪代码 | |------|-------… 1% Gin 毕设实战 — Go Web 开发从入门到上线 # Gin 毕设实战 — Go Web 开发从入门到上线 ## 前言 Gin 是国内 Go 后端开发的事实标准。它性能极高、API 简洁,非常适合毕设中需要高性能接口的场景(如数据处理、实时计算)。 ## 第一章:Gin 的 radix tree 路由 Gin 基于 httprouter 的压缩前缀树(radix tree),路由时间复杂度 O(log n): ``` GET /api/u… 1%