啊嘎哇在线工具箱

"AI人工智能入门教程"的目录

AI人工智能概述

AI人工智能是什么

AI人工智能组成有什么

AI人工智能涉及什么

AI人工智能为什么使用Python来开发AI

AI人工智能 Python的特点

AI人工智能 Python的重要功能

AI人工智能安装Python

AI人工智能机器学习的类型(ML)

AI人工智能最常见的机器学习算法

AI人工智能预处理数据

AI人工智能数据预处理技术

AI人工智能标记数据

AI人工智能在Python中构建分类器的步骤

AI人工智能在Python中构建分类器

AI人工智能逻辑回归

AI人工智能决策树分类器

AI人工智能随机森林分类器

AI人工智能分类器的性能

AI人工智能分类失衡问题

AI人工智能合奏技巧

AI人工智能在Python中构建回归器

AI人工智能如何用逻辑编程解决问题

AI人工智能安装必需的包

AI人工智能逻辑编程的例子

AI人工智能查找素数

AI人工智能解决难题

AI人工智能聚类概述

AI人工智能数据聚类算法

AI人工智能自然语言处理

AI人工智能导入NLTK

AI智能标记化，词干化和词形化的概念

AI人工智能块化:将数据分割成块

AI人工智能词袋(BOW)模型

AI人工智能解决问题

AI人工智能主题建模

AI人工智能时间序列数据介绍

AI人工智能 Pandas

AI人工智能从时间序列数据中提取统计信息

AI人工智能隐马尔可夫模型(HMM)分析顺序数据

AI人工智能语音识别

AI人工智能构建语音识别器

AI人工智能可视化音频信号 - 从文件读取并进行处理

AI人工智能表征音频信号:转换到频域

AI人工智能生成单调音频信号

AI人工智能语音特征提取

AI人工智能口语词的识别

AI 人工智能概念

AI人工智能约束满足解决的现实世界问题

AI人工智能算法

AI人工智能模拟游戏

AI人工智能神经网络概述

AI人工智能基于感知器的分类器

AI人工智能单层神经网络

AI人工智能多层神经网络

AI人工智能强化学习基础

AI人工智能构建模块：环境和代理

AI人工智能用Python构建环境

AI人工智能用Python构建一个学习代理

AI人工智能遗传算法

AI人工智能遗传算法概述

AI人工智能使用遗传算法实现解决方案

AI人工智能概述

AI人工智能读取，写入和显示图像

AI人工智能色彩空间转换

AI人工智能边缘检测

AI人工智能人脸检测

AI人工智能机器学习VS深度学习

AI人工智能卷积神经网络（CNN）

AI人工智能入门教程 AI人工智能语音特征提取

2024-02-26 开发教程 AI人工智能入门教程匿名 18℃

这是构建语音识别器的最重要步骤，因为在将语音信号转换为频域后，我们必须将其转换为可用的特征向量形式。可以为此使用不同的特征提取技术，如 MFCC，PLP，PLP-RASTA 等。

示例

在以下示例中，我们将使用 MFCC 技术逐步使用 Python 从信号中提取特征。

导入必要的软件包，如下所示 -

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from python_speech_features import mfcc, logfbank

现在，读取存储的音频文件。它会返回两个值 - 采样频率和音频信号。提供存储音频文件的路径。

frequency_sampling, audio_signal = wavfile.read("/Users/admin/audio_file.wav")

请注意，在此首先抽取15000个样本进行分析。

audio_signal = audio_signal[:15000]

使用 MFCC 技术并执行以下命令来提取 MFCC 特征 -

features_mfcc = mfcc(audio_signal, frequency_sampling)
Python

现在，打印 MFCC 参数，如下所示 -

print('\nMFCC:\nNumber of windows =', features_mfcc.shape[0])
print('Length of each feature =', features_mfcc.shape[1])

使用下面给出的命令绘制并可视化 MFCC 特征 -

features_mfcc = features_mfcc.T
plt.matshow(features_mfcc)
plt.title('MFCC')

在这一步中，我们使用如下滤器组特征，提取过滤器组特征 -

filterbank_features = logfbank(audio_signal, frequency_sampling)

现在，打印过滤器组参数。

print('\nFilter bank:\nNumber of windows =', filterbank_features.shape[0])
print('Length of each feature =', filterbank_features.shape[1])

绘制并可视化过滤器组特征。

filterbank_features = filterbank_features.T
plt.matshow(filterbank_features)
plt.title('Filter bank')
plt.show()

根据上述步骤，您可以观察到以下输出:图1为 MFCC，图2为过滤器组。

上一节： AI人工智能生成单调音频信号

下一节： AI人工智能口语词的识别