注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络软件与程序设计实用自然语言处理(影印版)

实用自然语言处理(影印版)

实用自然语言处理(影印版)

定 价:¥142.00

作 者: AnujGupta,HarshitSurana
出版社: 东南大学出版社
丛编项:
标 签: 程序设计 计算机/网络

购买这本书可以去


ISBN: 9787564194925 出版时间: 2021-05-01 包装: 平装-胶订
开本: 16开 页数: 字数:  

内容简介

  许多书籍和课程都是通过一些小儿科般的用例和定义良好的数据集来解决自然语言处理(natural language processing,NLP)问题。但如果你想在商业环境中构建、迭代、扩展NLP系统,为特定的垂直行业进行量身定制,这本书就是你的行动指南。软件工程师和数据科学家将学会如何繁杂的选项迷宫中来去自如。在阅读过程中,本书作者Sowmya Vajjala、Bodhisattwa Majumder、Anuj Gupta、Harshit Surana将指导你构建嵌入在大型产品设置中的真实NLP解决方案。你会学到如何针对不同的垂直行业(如医疗保健、社交媒体和零售业)调整解决方案。在本书中,你将能够: 理解NLP中广泛的问题、任务和解决方法。 使用机器学习和深度学习的方法实现和评估不同的NLP应用。 根据业务问题和行业垂直度,微调NLP解决方案。 评估用于NLP产品任务、数据集和不同阶段的各种算法和方法。 形成遵循NLP系统发布、部署、DevOps实践的软件解决方案。 从业务和产品领导者的角度理解NLP的实践、机会和路线图。

作者简介

  Sowmya Vajjala,加拿大国家研究委员会(National Research Council)的研究人员。她在学术界和工业界都建立了多语言的NLP系统。Bodhisattwa Majumder,加州大学圣地亚哥分校的博士候选人。他在Google AI和Microsoft Research参与了NLP系统的构建。Anuj Gupta,Vahan的机器学习负责人。他曾在财富100强公司和初创企业中培养并领导了多支ML团队。Harshit Surana,Deep Flux的联合创始人和CTO。他曾在卡耐基梅隆大学和麻省理工学院媒体实验室(MIT Media)进行NLP和ML研究。

图书目录

Foreword
Preface
Part I. Foundations
1. NLP: A Primer
NLP in the Real World
NLP Tasks
What Is Language?
Building Blocks of Language
Why Is NLP Challenging?
Machine Learning, Deep Learning, and NLP: An Overview
Approaches to NLP
Heuristics-Based NLP
Machine Learning for NLP
Deep Learning for NLP
Why Deep Learning Is Not Yet the Silver Bullet for NLP
An NLP Walkthrough: Conversational Agents
Wrapping Up
2. NLP Pipeline
Data Acquisition
Text Extraction and Cleanup
HTML Parsing and Cleanup
Unicode Normalization
Spelling Correction
System-Specific Error Correction
Pre-Processing
Preliminaries
Frequent Steps
Other Pre-Processing Steps
Advanced Processing
Feature Engineering
Classical NLP/ML Pipeline
DL Pipeline
Modeling
Start with Simple Heuristics
Building Your Model
Building THE Model
Evaluation
Intrinsic Evaluation
Extrinsic Evaluation
Post-Modeling Phases
Deployment
Monitoring
Model Updating
Working with Other Languages
Case Study
Wrapping Up
3. Text Representation
Vector Space Models
Basic Vectorization Approaches
One-Hot Encoding
Bag of Words
Bag of N-Grams
TF-IDF
Distributed Representations
Word Embeddings
Going Beyond Words
Distributed Representations Beyond Words and Characters
Universal Text Representations
Visualizing Embeddings
Handcrafted Feature Representations
Wrapping Up
……
Part II. Essentials
Part III. Applied
Part IV. Bringing It All Together
Index

本目录推荐