语音识别时,人说一句“Hello”,尽管发音很标准,但是由于有停顿、换气或是其他原因,音频信息中的“H”音很容易对不上文本信息中的“H”。这就需要预处理对齐问题,但是用人工的方法手动对齐比较音频信息和文本信息,需要耗费大量的人力财力。CTC就是处理这一类对齐问题而生的技术。
动态规划 - Dynamic Programming
Posted on
|
Edited on
|
In
algorithm
Those who cannot remember the past are condemned to repeat.
-Dynamic Programming
LeetCode 79. Word Search(非递归算法)
Posted on
|
Edited on
|
In
algorithm
上次算法实验课的时候,助教问我可不可以用非递归的方式实现,回去之后折腾了好一会儿终于在LeetCode上AC了我的非递归版本,在这里分享一下。
基于TensorFlow的CAPTCHA注册码识别实验
Posted on
|
Edited on
|
In
deep learning
- 实验任务:使用TensorFlow实现CAPTCHA注册码的识别
- 基本思路:采用 Captcha 库生成验证码,将验证码识别问题转化为分类问题,采用 CNN 网络模型进行训练,最终实现对验证码的破解。
- 实验步骤:获取验证码训练集 → 构建卷积神经网络和全连接神经网络 → 定义损失函数以及优化方式 → 进行训练并保存训练结果。