Kaldi环境在mac虚拟机和linux下搭建

2019-11-06 08:24:17

字体：大中小

来源：转载

供稿：网友

Kaldi是开源语音识别工具平台。这款工具既可以在Windows下编译也可以在linux下编译。目前研究生的研究方向是深度学习的语音识别，所以开始进行一些初步的工作。由于家里的台式机和实验室的电脑都是普通PC机，而自己的笔记本又是mac PRo。所以准备同时在两种主机上搭建环境，不过参考说还是在Linux下做开发多一些，我就顺便把Linux装在mac的虚拟机上，就安了个虚拟机装上了Ubuntu14.04。文档里面也说还是建议在Linux下使用Kaldi。没怎么用过Linux了，用了一天的时间搭建Kaldi最后完成了并跑了一下测试例子。下面把过程记录和遇到问题记录一下。

1. 下载 Ubuntu 14.04 版本建议用这个版本，16的版本会带来一些问题，之后查到的资料和解决方法少。。2. 在 Windows 10 系统下面创建空白磁盘分区:- 右键我的电脑- 选择管理- 选择磁盘管理- 选择一个磁盘- 右键压缩卷- 压缩后的磁盘变成为未分配部分（80G）3. 下载并安装好软碟通(UltraISO)- 打开软件- 点击打开- 找到 Ubuntu 系统所在目录,找到 iso 文件并打开- 点击启动,选择写入硬盘镜像- 大概检查下各个选项(基本是默认格式)- 点击格式化- 点击写入- 刻录完成4. 从 USB 启动选择空闲空间安装 Ubuntu 即可（可以使用easyBCD进行系统启动切换）

之后还遇到装好了系统后分辨率非常不兼容的问题，由于我用的是34寸带鱼屏，用命令行修改分辨率无法解决，去N卡官网下载了linux对应的驱动.run格式，之后安装（安装方法自行读娘，提醒下要在无图形界面的模式下输入安装的命令行Ctrl+Alt+F1,否则报错）

安装 CUDA 以及 Kaldi 之前的基本配置

输入:sudo apt-get updatesudo apt-get install libtoolsudo apt-get install autoconfsudo apt-get install wgetsudo apt-get install perlsudo apt-get install subversionsudo apt-get install build-essentialsudo apt-get install gfortransudo apt-get install libatlas-devsudo apt-get install libatlas-base-devsudo apt-get install zlib1g-dev (中间的是数字 1)sudo apt-get install gawk

安装 CUDA（推荐CUDA下载安装）

到官方下载对应的包

https://developer.nvidia.com/cuda-downloads

Base Installer
Installation Instructions:
Run `sudo sh cuda_8.0.61_375.26_linux.run`Follow the command-line prompts

设置环境变量输入:sudo nano /etc/profile- 在文件的最后一行添加 PATH="$PATH:/usr/local/cuda-7.5/bin"- 然后保存并退出 Ctrl+字母输入:source /etc/profile输入:echo $PATH输入:sudo nano /etc/ld.so.conf- 在第二行写入 include /usr/local/cuda-7.5/lib64注:如果是第一次装机,先要设置一下 root 密码输入:sudo passwd rootroot 密码设置好之后,输入 su 进入 root 账号输入:ldconfig输入:exit输入:sudo service lightdm start

安装 Kaldi第一步:下载 Kaldi 源代码现在 Kaldi 的最新网址是:http://www.kaldi-asr.org/同时,下载地址是:https://github.com/kaldi-asr/kaldi下载后,提取并放在主文件夹下即可。注:推荐使用 Ubuntu 直接在浏览器下载,最好不要用 Windows 下载完之后用 U 盘拷贝过去,我当时就是这样做的,结果有些权限问题比较麻烦。第二步:准备阶段编译 Kaldi 之前需要完成:1. 修改 gcc 以及 g++版本注:Ubuntu14.04 默认安装的 gcc/g++版本是 4.8,编译 Kaldi 所需的版本要在 4.8 以下,所以需要要把 gcc/g++版本降成 4.61.1 首先查看安装的版本:输入:ls /usr/bin/gcc*如果没有版本 4.6,则需要安装:输入:sudo apt-get install gcc-4.6sudo apt-get install gcc-4.6-multilibsudo apt-get install g++-4.6sudo apt-get install g++-4.6-multilib1.2 安装之后选择当前版本修改 gcc输入:sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.8 50sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.6 40之后输入:sudo update-alternatives --config gcc之后手动选择所需 gcc 版本编号,输入 1,即选择当前 gcc 版本为 4.6,之后回车修改 g++输入:sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.8 50sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.6 40之后输入:sudo update-alternatives --config g++之后需要手动选择 g++版本编号,输入 1,即选择当前 g++版本为 4.6,之后回车1.3 修改后查看当前版本输入:gcc –versiong++ --version查看当前版本2. 修改默认 shell输入:sudo ln -s -f bash /bin/sh3. 安装 git输入:sudo apt-get install git

输入:

git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden下载的速度很慢 要有耐心，尤其是防止电脑休眠中断（掉过坑）
/tools目录下面全部都是Kaldi依赖的包。其中主要有：
OpenFST：Weighted Finite State Transducer library，是一个用来构造有限状态自动机的库。我们知道隐马尔科夫模型就可以看成是一个有限状态自动机的。这是最终要的一个包，Kaldi的文档里面说：If you ever want to understand Kaldi deeply you will need to understand OpenFst.诶，要学的好多。ATLAS：这是一个C++下的线性代数库。做机器学习自然是需要很多矩阵运算的。IRSTLM:这是一个统计语言模型的工具包。sph2pipe:这是宾夕法尼亚大学linguistic data consortium（LDC）开发的一款处理SPHERE_formatted数字音频文件的软件，它可以将LDC的sph格式的文件转换成其它格式。编译 Kaldi输入:cd ./kaldi-master/toolsmake –j 4注:如果中途没有退出的话就基本没问题了。需要注意的是安装过程中全程保持网络畅通。如果实在看下载进度条没速度,就自己下载好相应的包,放在应该存放的目录下即可。输入:cd ../src./configure注:检查 OpenFST 和 ATLAS 两个外部库是否安装成功,并且检查 CUDA 是否安装成功。没问题的话应该有如下显示:输入:make depend –j 4make –j 4
单独编译 cudamatrix输入:cd kaldi-maser/src/cudamatrix/sudo nano Makefile- 把文件中的 TESTFILES 改成 BINFILES输入:cd ~/kaldi-master/src/cudamatrixmake all./cu-vector-test测试之后技能现实成功








上一篇：入职腾讯一周感想


下一篇：教你如何撰写高质量毕业论文














发表评论
共有条评论






用户名:

密码:



验证码:

 

匿名发表


















学习交流
更多





索泰发布一款GTX 1070 Mini迷


AMD新旗舰显卡轻松干翻NVIDIA 






索泰发布一款GTX 1070 Mini迷你版本:小机
索泰发布一款GTX 1070 Mini迷你版本:小机箱大爱...






usb无线网卡怎么用,小编告诉你安装教程09-10

usb调试在哪,小编告诉你usb调试在哪09-10

优盘不显示,小编告诉你优盘不显示怎么办09-10

低级格式化,小编告诉你硬盘怎么低级格式化09-10




帝国cms分类信息的所在地在的修改09-08

将网站地图和友情链接table样式改为div+css09-08

用帝国cms实现不规则新闻或信息调用（应大站09-08

帝国调用DZ论坛精华帖09-08

用灵动标签调用discuz和phpwind的最新贴子09-08







热门图片
更多




芭蕾舞蹈表演，真实美到极致


下午茶时间，悠然自得的休憩




充斥这繁华奢靡气息的城市迪拜风景图片


从山间到田野再到大海美丽的自然风景图片




肉食主义者的最爱美食烤肉图片


夏日甜心草莓美食图片




人逢知己千杯少，喝酒搞笑图集


搞笑试卷，学生恶搞答题







猜你喜欢的新闻


荣耀总裁赵明乌镇演讲：荣耀首款5G手机V30下

搜狐张朝阳：回归媒体是搜狐重新崛起的关键

华为轮值董事长郭平：虚拟技术创造现实价值

第六届世界互联网大会开幕“to B”端成热门

滴滴英文服务上线两周年 用户已超200万

华为推出全球至快AI训练集群Atlas900

马斯克：特斯拉正组建中国技术团队

10年后6G将问世 速度有望比5G快100倍

WeworkCEO称已开始考虑未来职位 不排除放弃

谷歌软件商店模式变革：推出5美元会员 可用数





猜你喜欢的关注


【POJ 2528】Mayor&#39;s posters

spring maven 搭建dubbo框架(dubbo-admin)

【POJ 3667】Hotel

【POJ 2104】K-th Number&amp;主席树详解

flex4 spark 布局

CUDA线程协作之共享存储器“__shared__”&a

1038. Recover the Smallest Number (30)

字幕文件批量重命名脚本 —— Linux

1043. 输出PATest(20)

PAT甲级1003











新闻热点





荣耀总裁赵明乌镇演讲：荣耀首款5G手机V30下月发布
2019-10-23 09:17:05






搜狐张朝阳：回归媒体是搜狐重新崛起的关键
2019-10-21 09:20:02






华为轮值董事长郭平：虚拟技术创造现实价值
2019-10-21 09:00:12






滴滴英文服务上线两周年 用户已超200万
2019-09-26 08:57:12






华为推出全球至快AI训练集群Atlas900
2019-09-25 08:46:36






马斯克：特斯拉正组建中国技术团队
2019-09-25 08:15:43











疑难解答




索泰发布一款GTX 1070 Mini迷你版本:小机箱

AMD新旗舰显卡轻松干翻NVIDIA 有几个点我们

i5 6500配什么显卡最佳？i5 6500配1060显卡可

AMD新一批显卡曝光:更便宜的14nm北极星

A卡自修改BIOS安装16.12.1 ReLive驱动教程 

2016笔记本显卡性能哪个好？笔记本显卡天梯图

2016显卡性能怎么看好坏 显卡天梯图2016年1

PS4 Pro显卡解析:显存带宽相当于标准版PS4

iGame 1050烈焰战神U-2GD5版图赏版:最美非

EVGA FTW GTX 1080/1070显卡存在严重问题:







图片精选




Dictionary数据类型在Darwin视频服



可穿戴手势识别控制器



Dictionary数据类型在Darwin视频服



可穿戴手势识别控制器











网友关注




u盘无法识别怎么办,小编告诉你U盘无法识别怎

usb无线网卡怎么用,小编告诉你安装教程

usb调试在哪,小编告诉你usb调试在哪

优盘不显示,小编告诉你优盘不显示怎么办

低级格式化,小编告诉你硬盘怎么低级格式化

分区表丢失,小编告诉你分区表丢失如何修复

进入bios,小编告诉你戴尔笔记本进入bios设置u

怎么刷bios,小编告诉你华硕怎么刷bios

读卡器怎么用,小编告诉你如何使用读卡器

bios升级,小编告诉你华硕主板bios怎么升级