Library Search
结果页

Scikit-learn 机器学习入门实战

在 元器件 / 技术栈 / 知识库 中找到 16 个匹配结果。

返回文档库
技术栈

技术栈

8 个
查看全部
Scikit-learn # Scikit-learn 机器学习入门实战 ## 背景 Scikit-learn 提供了「瑞士军刀」式的机器学习工具箱。无论你是做表格数据的分类、用户分群还是异常检测,掌握它能让你在几分钟内完成从数据处理到模型评估的完整流程。 --- ## 第 1 章:理解 API 设计哲学 Scikit-learn 所有模型遵循统一接口: | 模式 | 伪代码 | |------|-------… 3% ONNX 定义了一种标准化的计算图表示,让 PyTorch / TensorFlow / scikit-learn 训练的模型可以导出为 `.onnx`,然后在任何支持 ONNX 的推理引擎上运行。 **核心价值:** - **跨框架互操作**:训练用 PyTorch,推理用 ONNX Runtime,告别框架锁定 - **推理加速**:ONNX Runtime 内置图优化(常量折叠/算子融合),速度提升… 3% XGBoost t。 **核心价值:** - **极致性能**:C++ 底层,多线程并行,比 scikit-learn GBDT 快 10x+ - **正则化**:L1/L2 防止过拟合,比传统 GBDT 泛化更好 - **原生缺失值处理**:自动学习缺失值最佳分支方向 - **GPU 加速**:`tree_method='gpu_hist'` 再加速 5-20x - **可解释性**:`plot_import… 2% NumPy NumPy 的定位 ``` Python 科学计算栈层级: 应用层: scikit-learn | TensorFlow/PyTorch | SciPy ↓ ↓ ↓ 中间层: Pandas | NumPy (ndarray) | Matplotlib ↓… 2% PyTorch 1. 动态计算图相比静态图,性能上有损失吗?PyTorch 2.0 的 `torch.compile` 如何解决? 2. `optimizer.zero_grad()` 如果忘记调用会怎样? 3. `model.train()` 和 `model.eval()` 具体影响了哪些层的行为? 4. 为什么 `CrossEntropyLoss` 的输入不能经过 softmax? # PyTorch 进… 1% FastAI ## FastAI FastAI 是由 Jeremy Howard 和 Rachel Thomas 创建的**PyTorch 顶层深度学习框架**,核心理念是"让深度学习民主化"。它基于类型派发(type dispatch)将最佳实践自动应用到各任务类型上,用 4 行代码训练出 SOTA 模型。 **核心价值:** - **傻瓜式训练**:`vision_learner(dls, resnet… 1% MLflow # MLflow 入门教程:四大组件实战 ## 1. MLflow 的四大支柱 ``` Tracking ──── 记录参数/指标/模型 artifact Projects ──── 打包训练代码为可复现单元 Models ──── 统一模型格式,跨部署平台 Registry ──── 模型版本管理与审批流转 ``` ## 2. Tracking:手动 vs 自动 ### autolog… 1% OpenCV # OpenCV 毕设入门教程——计算机视觉实战 ## 前言 OpenCV 是毕设中**图像处理/计算机视觉**方向的首选库。常见毕设题目:**车牌识别、人脸考勤系统、手势识别、医学图像分割、车道线检测**。 --- ## 第一章:OpenCV 核心数据结构 ### cv::Mat —— 一切图像的基础 ```cpp cv::Mat img;… 1%
知识库

知识库

8 个
Scikit-learn 机器学习入门实战 # Scikit-learn 机器学习入门实战 ## 背景 Scikit-learn 提供了「瑞士军刀」式的机器学习工具箱。无论你是做表格数据的分类、用户分群还是异常检测,掌握它能让你在几分钟内完成从数据处理到模型评估的完整流程。 --- ## 第 1 章:理解 API 设计哲学 Scikit-learn 所有模型遵循统一接口: | 模式 | 伪代码 | |------|-------… 3% Hello World — 鸢尾花分类 # Scikit-learn Hello World:鸢尾花分类 ## 目标 使用经典的 Iris 数据集,训练一个随机森林分类器并评估准确率。这是 scikit-learn 最经典的入门示例。 ## 完整代码 ```python from sklearn.datasets import load_iris from sklearn.model_selection import train_… 3% 01-从零入门教程 NumPy 的定位 ``` Python 科学计算栈层级: 应用层: scikit-learn | TensorFlow/PyTorch | SciPy ↓ ↓ ↓ 中间层: Pandas | NumPy (ndarray) | Matplotlib ↓… 2% 02-进阶实战-迁移学习与部署 # PyTorch 进阶实战 —— 迁移学习、混合精度与模型部署 ## 本章目标 - 使用预训练模型进行迁移学习(Fine-tuning) - 掌握混合精度训练(AMP)加速 - 模型导出:TorchScript → ONNX - 模型量化与推理优化 ## 1. 迁移学习(Fine-tuning) ### 1.1 使用 torchvision 预训练模型 ```python import… 2% 02-进阶实战-测试-安全-部署 # Django 进阶实战 —— 测试、安全与部署 ## 本章目标 - 编写单元测试与集成测试 - 理解 Django 安全机制与最佳实践 - 使用 PostgreSQL + Gunicorn + Nginx 生产部署 - 掌握 Django 性能优化技巧 ## 1. 测试体系 ### 1.1 单元测试 ```python # blog/tests/test_models.py from… 1% 鸢尾花分类:训练 + 交叉验证 + 特征重要性 ` ## 运行步骤 ```bash pip install xgboost scikit-learn matplotlib python xgboost_iris.py ``` ## 预期输出 ``` 测试准确率: 0.9667 分类报告: precision recall f1-score support setosa 1… 1% MLflow 四件套:Tracking_Projects_Models_Registry # MLflow 入门教程:四大组件实战 ## 1. MLflow 的四大支柱 ``` Tracking ──── 记录参数/指标/模型 artifact Projects ──── 打包训练代码为可复现单元 Models ──── 统一模型格式,跨部署平台 Registry ──── 模型版本管理与审批流转 ``` ## 2. Tracking:手动 vs 自动 ### autolog… 1% OpenCV 毕设入门教程——计算机视觉实战 # OpenCV 毕设入门教程——计算机视觉实战 ## 前言 OpenCV 是毕设中**图像处理/计算机视觉**方向的首选库。常见毕设题目:**车牌识别、人脸考勤系统、手势识别、医学图像分割、车道线检测**。 --- ## 第一章:OpenCV 核心数据结构 ### cv::Mat —— 一切图像的基础 ```cpp cv::Mat img;… 1%