语音 信息处理

语音 = 声音加语义 (其他信息)

两个基本特点 振动冲击空气产生声波 自然物质 人类用声音符号 代表概念 反映现实

大自然获取信息

  • 60% 视觉
  • 20% 语音
  • 20% 其他信息 (无从考证 视觉>语音 比例未知) 内容多(视觉) 复杂度高(语音)

所得税 上限。

  • 标题

不同的语音系统之间的区别和共性。

发音 — 传递 — 感知 心理 — 生理 物理现象 空气媒介传递到人耳 生理到心理 被听话人感知

Speech chain

Planning articulatory movement speech signal speech perception speech cognition language/knowledge articulatorily-induced.感应 auditory images.

learner teacher. 建立汉语语音知识。

i+1 学习体系。

人工 植入声带替代品 难度大

语言康复 人工耳蜗 知觉传导的电流..

工程近似

进一步细化 问题。

discrete input 离散输入

information rate

6 Bytes -- 5000 Bytes 语音和文字 成百上千倍

语音中包含大量其他信息。 音色 说话人 etc.

  • 发语音给妈妈 传递的内容一样

语音科学研究

  • 语音学 phonetic discover(发现) 发音语音学 当代的生理语音学
  • 现代化工具利用
  • 感知语音学 语音到心理的过程
  • 音系学 phonology 交际功能

神经语言学 electroencephalogram EEG 脑电检测

ERP event-related potentials

人类逆向工程

行为表现和大脑的关系(物理基础)

老/新问题 新/老方法 新结果

语音 工科研究学科 (engineering)

  • 语音有效传送
  • 人机交互界面
  • 语音识别和理解
  • 语音合成
  • 对话系统
  • 话者识别(身份信息)
  • 安全系统
  • 语音翻译系统
  • 语音教学系统

paper reading

聚类的办法

HAC hierarchical Agglomerative Clustering

K-means

假设检验

UPP 后验概率

MFCC

log-UPP

2018.11.5

模式识别 人工智能 机器学习

语音相关的模式识别

  • 基础
  • 贝叶斯分类器
  • 线性,非线性

Pattern Recognition Fundamentals 目标函数 , 优化算法 Classification feature Feature vectors

粗体 x 特征矢量

欧米伽 ω

Types of problems

Supervised: classes are known beforehand and data samples of each class are available;

Unsupervised: classes are not known beforehand, must be inferred from the data;

发表评论