javax.portlet.title.080818

数学之美

作者:吴军著
出版社:人民邮电出版社
出版时间:2012
简介:本书揭示了信息和自然语言处理以及它们在通信和互联网各种应用(语音识别、机器翻译、搜索、分类等)中的数学原理。

目录

目录
出版说明
序言1
序言2
前言
第1章
文字和语言vs数字和信息
1
信息
2
文字和数字
3
文字和语言背后的数学
4
小结
第2章
自然语言处理——从规则到统计
1
机器智能
2
从规则到统计
3
小结
第3章
统计语言模型
1
用数学的方法描述语言规律
2
延伸阅读:统计语言模型的工程诀窍
3
小结
第4章
谈谈中文分词
1
中文分词方法的演变
2
延伸阅读:工程上的细节问题
3
小结
第5章
隐含马尔可夫模型
1
通信模型
2
隐含马尔可夫模型
3
延伸阅读:隐含马尔可夫模型的训练
4
小结
第6章
信息的度量和作用
1
信息熵
2
信息的作用
3
延伸阅读:信息论在信息处理中的应用
4
小结
第7章
贾里尼克和现代语言处理
1
早年生活
2
从水门事件到莫妮卡·莱温斯基
3
一位老人的奇迹
第8章
简单之美——布尔代数和搜索引擎的索引
1
布尔代数
2
索引
3
小结
第9章
图论和网络爬虫
1
图论
2
网络爬虫
3
延伸阅读:图论的两点补充说明
4
小结
第10章
PageRank——Google的民主表决式网页排名技术
1
PageRank算法的原理
2
延伸阅读:PageRank的计算方法
3
小结
第11章
如何确定网页和查询的相关性
1
搜索关键词权重的科学度量TF-IDF
2
延伸阅读:TF-IDF的信息论依据
3
小结
第12章
地图和本地搜索的最基本技术——有限状态机和动态规划
1
地址分析和有限状态机
2
全球导航和动态规划
3
延伸阅读:有限状态传感器
4
小结
第13章
Google AK-47的设计者——阿米特·辛格博士
第14章
余弦定理和新闻的分类
1
新闻的特征向量
2
向量距离的度量
3
延伸阅读:计算向量余弦的技巧
4
小结
第15章
矩阵运算和文本处理中的两个分类问题
1
文本和词汇的矩阵
2
延伸阅读:奇异值分解的方法和应用场景
3
小结
第16章
信息指纹及其应用
1
信息指纹
2
信息指纹的用途
3
延伸阅读:信息指纹的重复性和相似哈希
4
小结
第17章
由电视尉《暗算》所想到的——谈谈密码学的数学原理
1
密码学的自发时代
2
信息论时代的密码学
3
小结
第18章
闪光的不一定是金子——谈谈搜索引擎反作弊问题
第19章
谈谈数学模型的重要性
第20章
不要把鸡蛋放到一个篮子里——谈谈最大熵模型
1
最大熵原理和最大熵模型
2
最大熵模型的训练
3
小结
第21章
拼音输入法的数学原理
1
输入法与编码
2
输入一个汉字需要敲多少个键——谈谈香农第一定理
3
拼音转汉字的算法
4
延伸阅读:个性化的语言模型
5
小结
第22章
自然语言处理的教父马库斯和他的优秀弟子们
1
教父马库斯
2
从宾夕法尼亚大学走出的精英们
第23章
布隆过滤器
1
布隆过滤器的原理
2
延伸阅读:布隆过滤器的误识别问题
3
小结
第24章
马尔可夫链的扩展——贝叶斯网络
1
贝叶斯网络
2
贝叶斯网络在词分类中的应用
3
延伸阅读:贝叶斯网络的训练
4
小结
第25章
条件随机场和句法分析
1
句法分析计算机算法的演变
2
条件随机场
3
小结
第26章
维特比和他的维特比算法
1
维特比算法
2
CDMA技术——3G移动通信的基础
3
小结
第27章
再谈文本自动分类问题——期望最大化算法
1
文本的自收敛分类
2
延伸阅读:期望最大化和收敛的必然性
3
小结
第28章
逻辑回归和搜索广告
1
搜索广告的发展
2
逻辑回归模型
3
小结
第29章
各个击破算法和Google云计算的基础
1
分治算法的原理
2
从分治算法到MapReduce
3
小结
附录
后记
索引