Library Search
结果页NLTK 与 NLP 基础:语料库、语法树与分类器
在 元器件 / 技术栈 / 知识库 中找到 12 个匹配结果。
技术栈
技术栈
6 个 NLTK # NLTK 入门教程:语料库、语法树与分类器
## 1. NLTK 的定位
NLTK 不是工业级工具(那是 spaCy 的事),而是**NLP 教学的瑞士军刀**。它的价值在于让你理解"分词到底在干什么"、"语法树怎么构建"——而不是黑盒调用。
> 「如果你只想知道结果,用 spaCy。如果你想理解为什么,用 NLTK。」
## 2. 内置语料库
```python
from nltk… 3% spaCy web_sm")` 即可处理中文
- **极速推理**:Cython 实现,比 NLTK 快 100x+,生产环境首选
- **Transformer 融合**:`spacy-transformers` 接入 BERT 提升精度
- **可扩展组件**:EntityRuler / SpanCategorizer 等可插拔组件
- **规则 + 统计混合**:Matcher 做规则,NER 做统计,… 3% PaddlePaddle # PaddlePaddle 入门教程:ERINE 与产业套件全景
## 1. PaddlePaddle 的"双引擎"
PaddlePaddle 的核心差异化在于**产业套件 > 基础框架**:
```
PaddlePaddle 核心框架
├── 动态图开发(dygraph)
├── 静态图部署(static graph)
└── 自动混合精度(AMP)
产… 2% Pytest # Pytest 测试框架完全指南
## 背景
测试是软件质量的基石。Pytest 把编写测试这件事从「负担」变成「享受」——它极简的语法让你无需继承 TestCase、无需记忆 30 种 assert 方法,只需写普通的 assert 语句。
---
## 第 1 章:Fixture 依赖注入
Fixture 是 Pytest 最核心的概念,用于准备测试所需的资源。
```pytho… 1% Neo4j # Neo4j 从零到实战:社交网络图谱
## 1. 背景与概念
### 1.1 图数据库 vs 关系型数据库
在社交网络中,查询"朋友的朋友"在 SQL 中需要多次 JOIN(O(n²) 复杂度),而图数据库通过指针跳转做到 O(1)。
```
SQL: SELECT * FROM friends f1
JOIN friends f2 ON f1.target = f2… 1% PHPUnit ## PHPUnit\n\nPHPUnit 是 PHP 生态的事实标准测试框架,由 Sebastian Bergmann 创建。它实现了 xUnit 架构,支持单元测试、集成测试、Mock 对象和代码覆盖率分析。\n\n### 核心特性\n\n- **xUnit 架构**:经典的 TestCase / TestSuite 模式\n- **断言库**:100+ 内置断言方法\n- **Mock 对象… 1%
知识库
知识库
6 个 NLTK 与 NLP 基础:语料库、语法树与分类器 # NLTK 入门教程:语料库、语法树与分类器
## 1. NLTK 的定位
NLTK 不是工业级工具(那是 spaCy 的事),而是**NLP 教学的瑞士军刀**。它的价值在于让你理解"分词到底在干什么"、"语法树怎么构建"——而不是黑盒调用。
> 「如果你只想知道结果,用 spaCy。如果你想理解为什么,用 NLTK。」
## 2. 内置语料库
```python
from nltk… 3% 经典 NLP Pipeline:分词 → POS → NER → 词频 # NLTK 经典 NLP Pipeline
## 目标
展示 NLTK 的标准 NLP 处理流程:分词 → 词性标注 → 命名实体识别 → 词干提取 → 词频统计。
## 完整代码
```python
import nltk
import ssl
# 首次运行取消注释:
# try: _create_unverified_https_context = ssl._create_unve… 3% 从 Pipeline 组件到自定义 NER 训练 r ent in doc.ents])
```
## 6. spaCy vs NLTK vs Stanza
| 维度 | spaCy | NLTK | Stanza |
|------|-------|------|--------|
| 速度 | ⭐⭐⭐ 极快 | ⭐ 慢 | ⭐⭐ 中等 |
| 易用性 | ⭐⭐⭐ | ⭐⭐ | ⭐⭐ |
| 学术支持 | 较少 | 丰富(教材) | 丰富(… 2% 飞桨生态系统:ERNIE + 动静统一 + 产业套件 # PaddlePaddle 入门教程:ERINE 与产业套件全景
## 1. PaddlePaddle 的"双引擎"
PaddlePaddle 的核心差异化在于**产业套件 > 基础框架**:
```
PaddlePaddle 核心框架
├── 动态图开发(dygraph)
├── 静态图部署(static graph)
└── 自动混合精度(AMP)
产… 2% Pytest 测试框架完全指南 # Pytest 测试框架完全指南
## 背景
测试是软件质量的基石。Pytest 把编写测试这件事从「负担」变成「享受」——它极简的语法让你无需继承 TestCase、无需记忆 30 种 assert 方法,只需写普通的 assert 语句。
---
## 第 1 章:Fixture 依赖注入
Fixture 是 Pytest 最核心的概念,用于准备测试所需的资源。
```pytho… 1% 社交网络图谱实战 # Neo4j 从零到实战:社交网络图谱
## 1. 背景与概念
### 1.1 图数据库 vs 关系型数据库
在社交网络中,查询"朋友的朋友"在 SQL 中需要多次 JOIN(O(n²) 复杂度),而图数据库通过指针跳转做到 O(1)。
```
SQL: SELECT * FROM friends f1
JOIN friends f2 ON f1.target = f2… 1%