Library Search
结果页NLTK 与 NLP 基础:语料库、语法树与分类器
在 知识库 中找到 8 个匹配结果。
知识库
知识库
8 个 NLTK 与 NLP 基础:语料库、语法树与分类器 # NLTK 入门教程:语料库、语法树与分类器
## 1. NLTK 的定位
NLTK 不是工业级工具(那是 spaCy 的事),而是**NLP 教学的瑞士军刀**。它的价值在于让你理解"分词到底在干什么"、"语法树怎么构建"——而不是黑盒调用。
> 「如果你只想知道结果,用 spaCy。如果你想理解为什么,用 NLTK。」
## 2. 内置语料库
```python
from nltk… 3% 经典 NLP Pipeline:分词 → POS → NER → 词频 # NLTK 经典 NLP Pipeline
## 目标
展示 NLTK 的标准 NLP 处理流程:分词 → 词性标注 → 命名实体识别 → 词干提取 → 词频统计。
## 完整代码
```python
import nltk
import ssl
# 首次运行取消注释:
# try: _create_unverified_https_context = ssl._create_unve… 3% 从 Pipeline 组件到自定义 NER 训练 r ent in doc.ents])
```
## 6. spaCy vs NLTK vs Stanza
| 维度 | spaCy | NLTK | Stanza |
|------|-------|------|--------|
| 速度 | ⭐⭐⭐ 极快 | ⭐ 慢 | ⭐⭐ 中等 |
| 易用性 | ⭐⭐⭐ | ⭐⭐ | ⭐⭐ |
| 学术支持 | 较少 | 丰富(教材) | 丰富(… 3% 飞桨生态系统:ERNIE + 动静统一 + 产业套件 # PaddlePaddle 入门教程:ERINE 与产业套件全景
## 1. PaddlePaddle 的"双引擎"
PaddlePaddle 的核心差异化在于**产业套件 > 基础框架**:
```
PaddlePaddle 核心框架
├── 动态图开发(dygraph)
├── 静态图部署(static graph)
└── 自动混合精度(AMP)
产… 3% Pytest 测试框架完全指南 # Pytest 测试框架完全指南
## 背景
测试是软件质量的基石。Pytest 把编写测试这件事从「负担」变成「享受」——它极简的语法让你无需继承 TestCase、无需记忆 30 种 assert 方法,只需写普通的 assert 语句。
---
## 第 1 章:Fixture 依赖注入
Fixture 是 Pytest 最核心的概念,用于准备测试所需的资源。
```pytho… 2% 社交网络图谱实战 # Neo4j 从零到实战:社交网络图谱
## 1. 背景与概念
### 1.1 图数据库 vs 关系型数据库
在社交网络中,查询"朋友的朋友"在 SQL 中需要多次 JOIN(O(n²) 复杂度),而图数据库通过指针跳转做到 O(1)。
```
SQL: SELECT * FROM friends f1
JOIN friends f2 ON f1.target = f2… 2% Envoy 服务网格数据平面入门 - 学习 Istio + Envoy 搭建完整 Service Mesh
- 学习 Envoy WASM 插件开发
- 学习 Envoy 作为 Kubernetes Ingress Controller 1% 入门教程 - Grok 解析与管道架构 # Logstash 入门教程:Grok 解析与管道架构
## 1. Logstash 在 ELK 中的位置
```
Filebeat(采集) → Logstash(处理) → Elasticsearch(存储) → Kibana(可视化)
↑ ↑
轻量级代理… 1%