Google发布语音指令数据集
深度学习在语音识别方面的使用方兴未艾,但是可用的训练数据集却不多见。虽然Kaldi这种软件可以使用神经网络进行训练,但是复杂的操作吓退了很多小白。Google认识到,互联网上没有可供入门者快速入门深度学习的语言数据集,所以他们开源了语音指令数据集。
TensorFlow和AIY团队开源的数据集包含65000个录音,每个录音时长几秒钟,包含30个左右的单词。它们是通过网站采集而来的,参与人数达到了数千人。团队贴心地附上了训练和预测的TensorFlow示例代码。数据集基于署名4.0 国际(CC By 4.0)许可发布,Google表示将继续扩充这个数据集。Google还指出,这个数据集特别适合新手入门。此外,他们也开源了收集录音的工具。
对于想尝鲜的人,Google制作了一个基于TensorFlow的Android程序。程序会询问获取麦克风权限,随后会给出10个单词,程序将高亮显示已经被你读过的单词。
这个例子的效果和数据集有很大的关系,有可能不尽如人意,毕竟商业语言识别系统比这个复杂的多。Google希望随着更多的数据加入,模型的识别效果会日趋完善。
使用TensorFlow进行语言识别的教程可以在这里找到。使用最新版本的TensorFlow和主流配置,模型训练只需要几个小时。对神经网络进行微调可以解决不同的问题,例如不同的响应时间、大小,以及在不同平台上的准确度取舍问题。
大数据时代,大数据培训,就选光环大数据、数据分析师培训机构!
大数据培训、人工智能培训、Python培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请专业的大数据领域知名讲师,确保教学的整体质量与教学水准。讲师团及时掌握时代潮流技术,将前沿技能融入教学中,确保学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式,指导学生更快的掌握技能知识,成就上万个高薪就业学子。 更多问题咨询,欢迎点击------>>>>在线客服!