Library Search
结果页

NLTK 与 NLP 基础:语料库、语法树与分类器

在 知识库 中找到 8 个匹配结果。

返回文档库
知识库

知识库

8 个
NLTK 与 NLP 基础:语料库、语法树与分类器 # NLTK 入门教程:语料库、语法树与分类器 ## 1. NLTK 的定位 NLTK 不是工业级工具(那是 spaCy 的事),而是**NLP 教学的瑞士军刀**。它的价值在于让你理解"分词到底在干什么"、"语法树怎么构建"——而不是黑盒调用。 > 「如果你只想知道结果,用 spaCy。如果你想理解为什么,用 NLTK。」 ## 2. 内置语料库 ```python from nltk… 3% 经典 NLP Pipeline:分词 → POS → NER → 词频 # NLTK 经典 NLP Pipeline ## 目标 展示 NLTK 的标准 NLP 处理流程:分词 → 词性标注 → 命名实体识别 → 词干提取 → 词频统计。 ## 完整代码 ```python import nltk import ssl # 首次运行取消注释: # try: _create_unverified_https_context = ssl._create_unve… 3% 从 Pipeline 组件到自定义 NER 训练 r ent in doc.ents]) ``` ## 6. spaCy vs NLTK vs Stanza | 维度 | spaCy | NLTK | Stanza | |------|-------|------|--------| | 速度 | ⭐⭐⭐ 极快 | ⭐ 慢 | ⭐⭐ 中等 | | 易用性 | ⭐⭐⭐ | ⭐⭐ | ⭐⭐ | | 学术支持 | 较少 | 丰富(教材) | 丰富(… 3% 飞桨生态系统:ERNIE + 动静统一 + 产业套件 # PaddlePaddle 入门教程:ERINE 与产业套件全景 ## 1. PaddlePaddle 的"双引擎" PaddlePaddle 的核心差异化在于**产业套件 > 基础框架**: ``` PaddlePaddle 核心框架 ├── 动态图开发(dygraph) ├── 静态图部署(static graph) └── 自动混合精度(AMP) 产… 3% Pytest 测试框架完全指南 # Pytest 测试框架完全指南 ## 背景 测试是软件质量的基石。Pytest 把编写测试这件事从「负担」变成「享受」——它极简的语法让你无需继承 TestCase、无需记忆 30 种 assert 方法,只需写普通的 assert 语句。 --- ## 第 1 章:Fixture 依赖注入 Fixture 是 Pytest 最核心的概念,用于准备测试所需的资源。 ```pytho… 2% 社交网络图谱实战 # Neo4j 从零到实战:社交网络图谱 ## 1. 背景与概念 ### 1.1 图数据库 vs 关系型数据库 在社交网络中,查询"朋友的朋友"在 SQL 中需要多次 JOIN(O(n²) 复杂度),而图数据库通过指针跳转做到 O(1)。 ``` SQL: SELECT * FROM friends f1 JOIN friends f2 ON f1.target = f2… 2% Envoy 服务网格数据平面入门 - 学习 Istio + Envoy 搭建完整 Service Mesh - 学习 Envoy WASM 插件开发 - 学习 Envoy 作为 Kubernetes Ingress Controller 1% 入门教程 - Grok 解析与管道架构 # Logstash 入门教程:Grok 解析与管道架构 ## 1. Logstash 在 ELK 中的位置 ``` Filebeat(采集) → Logstash(处理) → Elasticsearch(存储) → Kibana(可视化) ↑ ↑ 轻量级代理… 1%