口语100和语音感知心理模型的技术发展
感知心理声学模型,是用计算机模拟人听觉的技术方向。
感知心理声学(Psychoacoustics ),是美国兴起的基础学科,MP3的巨大成功根源于此。学科奠基性的泰斗,MIT教授Ken Stevens (2001年获得美国总统奖),是朱博士在加州大学的博士导师爷(导师的导师)。在用计算机建模和模拟语音的感知心理的努力上,朱博士走在世界的前沿。和统计模型不同,概率不再是模型的核心概念。 在清华长三角研究院的合作研究,让这个技术不断发展推进。和其他技术比较:模拟真人老师,准确有效的音节级智能语音互动纠正是它在全世界独一无二和无可比拟的特色。
科学家可以采用不同的模型来模拟人类听觉。 朱奇峰博士在过去几年,不断尝试研发新模型,更好的模拟人类听觉。
第一代线性模型(2005年)(中国有些企业如一起作业和金太阳曾使用过),初步尝试了频谱到听觉感受距离的直接机器映射,在准确性,和对噪音和非正常发音的辨别上还存在较多问题。 对语音评价之外的语调和流畅度不能进行评价。但已经能初步弥补外语师资缺乏问题,帮助学生提高。
第二代非线性模型(2010年),从根本上突破传统在语音分析中使用频谱的做法,采用全新非线性谱特征作为评价的基础,在准确性上带来突破。
第三代神经网络非线性模型(2011年)(英辅网,易唯网,韦博微口语),为模型带来学习和自适应能力。模型从死的成为活的,有“生命”的智能模型。
第四代云优化神经非线性模型(2013年),彻底改变的传统对“打分”的客观机械定义,更接近人类老师对分数的主观理解。分数不再是机器评分的一个映射,而是综合参考了和其他同学朗读情况的相对比较,同时能在线云学习,用的学生越多,智能老师就越聪明。这些革命性的技术突破,带来前所未有的学习体验。解放老师,提高学生。
口语100是唯一采用的是朱博士第四代模型的产品,在教学效果上大大提高。是真正有效帮助学术提高听说的技术。
和最新技术相比,老技术存在的问题
1. 准确度和一致性低。2. 没有语调Prosody(音调,流畅)的评估反馈。 3. 不是云计算,需要在计算机安装插件和计算。麻烦和低效。4. 不支持多平台。 因此是一个过时的技术,已经停止改进和发展。 而新技术完美解决这些问题。跨平台能力目前在全世界的智能外语教学领域也是独一无二。
口语100,把世界上好的,带给中国学生
不是每人每天都能用上真正世界第一的产品。 口语100是唯一采用第四代技术,并每3个月不断更新最新技术模型的产品,包括云计算平台,多终端技术,对语音语调流畅性统一评价,更准确更有效的帮助学生提高听说,使用方便,不需要安装插件和做复杂的麦克调整。是中国学生,老师,家长的唯一最佳选择,让孩子有限的学习练习时间,发挥最大的效果和价值。
口语100和Arivoc实验室,以世界领先的姿态,获得软银(中国)的投资,和百度第一大投资人的投资,和中国最牛基金经理的投资。以雄厚的实力支持研发中心,不断研发,全力服务和推进中国外语教育。
口语100,把世界上好的,带给中国学生。