【寻找十强】专访之二十二:让机器像人一样“说话”“学习”“陪伴”,薄言AI给孩子们做伙伴、做老师……

2018-05-25 16:42 来源:甬股交

  人工智能下围棋狂赢世界围棋大师,人工智能参加高考妥妥地数学拿到134分……毫无疑问,“人工智能”已是当前最前沿的科技之一。那些在科幻大片中看到的会说话、会思考的机器人,也许正在向你我走来。事实上,我们日常使用的手机上都有最简单的“人机对话”功能。

  宁波薄言信息科技有限公司十年磨一剑,让智能终端会“说话”、会“深度学习”。

  目前,他们的几款成熟产品已成功进入市场,当然这只是冰山一角,人工智能的前景和研究,会带给人类怎样的震撼和惊喜还远未可知……

  做AI,从学习语言开始李明,薄言的创始人和团队的核心人物,他是加拿大皇家学会院士,ACM/IEEE Fellow,加拿大最高科学奖Killam Prize获得者,滑铁卢大学讲座教授,清华大学长江学者讲座教授,宁波中国科学院信息技术应用研究院首席科学家。

  1980年,李明以高中学历直接考上中国科学院出国研究生,到美国留学,获得康奈尔大学的计算机博士学位。在执教滑铁卢大学之前,他曾在美国俄亥俄州立大学、哈佛大学和约克大学担任过教职。他的研究成果所产生的影响已经超越其计算机领域,并应用在计算机科学、生物信息、哲学、物理学、统计学等方面。他领导开发的PatternHunter、ExonHunter等生物信息学数据分析软件已被业界广泛接受。他运用深度神经网络,信息距离理论以及自然语言理解新技术开发了新一代聊天机器人——薄言超脑,被视为世界一流成果。可以说,李明在计算机的几个领域包括现代信息论、计算生物学、算法分析以及机器学习都做出了杰出贡献,称他是世界级专家一点不为过。

  在做这些基础性研究的时候,李明曾发现分析平均算法的复杂性。程序好还是坏,快还是慢,需要分析它的平均速度,这样的分析非常难,如果对每一个输入都去分析再加起来平均,工作量难以想象。而李明就发明了一种分析平均复杂度的新方法:如果能构造出一个有代表性的输入,只分析算法对这一个输入的时间复杂度,这就能代表大多数,也就有了所谓的平均复杂度。但这里有两个需要解决的问题,首先是有没有这样一个有代表性的输入,其二能不能找到。而李明就是利用“Kolmogorov复杂性”最终找到了这么一个有代表性的输入。使用这个方法,李明和他的同事解决了一系列计算机领域几十年没有解决的问题。

  当然,这些基础性的研究工作和创新,都是为多年后的“薄言”奠定基础。2006年,在加拿大的李明以敏锐的眼光洞察到了大数据的到来,他认为是时候做对话机器人了。虽然在当时,对话机器人并不流行。他联合清华大学的朱小燕教授组织了一个团队一起做项目和计划,并发表了重要论文,此时李明只有一个想法,“一定要把事情干起来!”

  然而研究人工智能并不是一件容易的事,其目的就是让计算机这样的机器能够像人一样”“思考”。其应用领域也很广泛,比如问题求解、逻辑推理与定理证明、智能信息检索技术,还有自然语言处理。自然语言的处理是人工智能技术应用于实际领域的典型范例,人类在这一领域已获得了大量可喜成果。计算机系统如何以主题和对话情境为基础,通过储备大量知识,生成和理解自然语言,这是一个极其复杂的编码和解码问题。“人类的高级智能,是从说话开始的。”李明说,“语言赋予了人们组织社会结构,思考和抽象的能力。因此,人工智能的革命,也应该从学习语言开始。”

  让机器人深入学习,需要一个“超脑”

  “采采芣苡,薄言采之。采采芣苡,薄言有之……”这是《诗经》里的一首诗,引申意为人们在大自然里辛勤愉快地劳作收获。

  要干成这样的“大事”,李明需要一个团队。在2013年,在国家政策扶持下,李明带领团队创建了宁波薄言信息技术有限公司。他们希望让全世界的用户和他们一起在机器人的深度自然语言理解上回归自然。李明介绍说,薄言团队的核心成员包括王靖波、熊琨、崔安颀、张泽峰。这个团队不同于其他团队,它是一个具有极强技术背景的人工智能团队,成员来自于康奈尔大学、哈佛大学、清华大学、北京大学、中科大少年班、滑铁卢大学以及国内外顶尖院校优秀毕业生。团队与加拿大滑铁卢大学、中国科学院计算所、清华大学等都有深入的高水平项目研发合作,并致力于自然语言处理研究及广泛应用。目前,团队已取得多项研究成果,包括语义理论、中英文问答系统等,被众多世界顶级学术期刊和学术会议收录。

  如何让机器来学习语言并深入思考?“深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。”沿着这条思路,经过10年的积淀和磨练,李明带领的薄言团队打造了薄言的“核心”——薄言超脑。薄言超脑是运行在大型GPU集群上的深度人工神经网络,拥有近十亿的神经元参数,能不间断地阅读互联网内容,组织结构和知识体系,已经积累了近2千万实体的知识网,3亿实体的语言表达,近百万领域专属知识,涵盖上千类别和中英文两种语言……薄言超脑在端到端对话生成、端到端问答(深层人工神经网络)的研究水平上,达到世界先进水平,其优势在于:扩展性强、持续积累中文语言理解语料和能力、迭代增长;系统的学习能力可形成长期壁垒,具有领先优势;信息距离理论及深度学习技术深度远超中文同类公司;定制化能力更适应AI产业市场需求。

  薄言豆豆:陪伴孩子的万能精灵

  终于,在薄言超脑这个平台上,2016年,薄言迎来了一个新成员——薄言豆豆(可以加微信公众号“薄言豆豆”来使用)。可以说,豆豆在目前世界上聊天机器人中是处于顶尖水平的。你问豆豆:“今天天气怎么怎么样?”它不但能准确告诉你今天的日期、温度、风力,更会给你提供出行意见以及穿衣指数等外延信息。聪明的豆豆不但知道今天天气情况如何,更知道明天、后天甚至大后天或用历史数据预测未来天气。

  曾有机构组织了一个测试,设计了1000个问题以测试国内多款聊天机器人的中文问答技术,最终结果是及格的只有豆豆一个。“其他有些机器人可能擅长对话而不关心知识。但是我觉得一个聊天机器人,只会简单对话肯定是不行的。你要想做好一个聊天机器人,就必须要有大量的知识做后盾。”李明说道,在薄言超脑这个平台,豆豆会通过读书、看报获取新的知识,并通过和人脑相似的多层神经网络,归纳新的概念以及他们之间的联系。可以说,薄言豆豆是一款以深度学习与神经网络为核心技术,语义理解能力领先的智能聊天机器人。

  人工智能的最初是关键词匹配的方式,到后来慢慢出现根据语序结构的模版来判断用户语言内容的手段;如今,横扫整个人工智能行业的深度学习被大量运用到对话机器人的训练中。李明说:“人工智能和自然语言处理的进步,首先一定要靠理论的进步,而不应该是工程上的关键字或模板匹配。”一个机器人能根据匹配和搜索关键字回答人类提出的一些问题,但这些工程的方法能力有限。“只有人工智能的理论不断发展,比如现在的深度学习,才能大大提高机器人的‘智能’”。

  “薄言豆豆”首先打破了关键字或模版匹配的传统方式,它不是一个工程而是一个科学,它基于的理论涉及物理、数学、计算机科学、哲学等学科领域。“薄言豆豆”以这些先进理论为基础能够自主学习,更新回答问题的内容。李明说:“我们还有一个置信神经网络,强化学习,调整对话逻辑,让豆豆变得更会说话。”

  如今,薄言豆豆已经能让暂时没有家长陪伴的孩子,通过豆豆一样可以实现对话、学习、成长。但这只是一个起步。“把薄言豆豆应用到医疗、智能家居、老年陪护、儿童陪护、给教师缺少的偏远山区做辅教??希望能对人们生活有用,给大家的生活带来方便,提高人们的幸福指数。”李明说。

  怀着美好愿景,十年磨一剑。李明带领团队用10年做好了一件事,坚守理论高地,力解人工智能60年没有解决的难题。而他最希望的是能跟大家一同见证中国人工智能语言交互处理科技走向世界,领导潮流,奉献社会。

责任编辑:陈慧慧

分享到

增值电信业务经营许可证:浙B2-20090110 互联网新闻信息服务许可证:3312006003 互联网出版许可证:新出网证(浙)字3号 网络文化经营许可:浙网文[2011]0053-008号

浙ICP备11040080-3 信息网络传播视听节目许可证:1104076 广播电视节目制作经营许可证:(浙)字第677号

【寻找十强】专访之二十二:让机器像人一样“说话”“学习”“陪伴”,薄言AI给孩子们做伙伴、做老师……

甬股交 责任编辑:陈慧慧 2018/05/25

  人工智能下围棋狂赢世界围棋大师,人工智能参加高考妥妥地数学拿到134分……毫无疑问,“人工智能”已是当前最前沿的科技之一。那些在科幻大片中看到的会说话、会思考的机器人,也许正在向你我走来。事实上,我们日常使用的手机上都有最简单的“人机对话”功能。

  宁波薄言信息科技有限公司十年磨一剑,让智能终端会“说话”、会“深度学习”。

  目前,他们的几款成熟产品已成功进入市场,当然这只是冰山一角,人工智能的前景和研究,会带给人类怎样的震撼和惊喜还远未可知……

  做AI,从学习语言开始李明,薄言的创始人和团队的核心人物,他是加拿大皇家学会院士,ACM/IEEE Fellow,加拿大最高科学奖Killam Prize获得者,滑铁卢大学讲座教授,清华大学长江学者讲座教授,宁波中国科学院信息技术应用研究院首席科学家。

  1980年,李明以高中学历直接考上中国科学院出国研究生,到美国留学,获得康奈尔大学的计算机博士学位。在执教滑铁卢大学之前,他曾在美国俄亥俄州立大学、哈佛大学和约克大学担任过教职。他的研究成果所产生的影响已经超越其计算机领域,并应用在计算机科学、生物信息、哲学、物理学、统计学等方面。他领导开发的PatternHunter、ExonHunter等生物信息学数据分析软件已被业界广泛接受。他运用深度神经网络,信息距离理论以及自然语言理解新技术开发了新一代聊天机器人——薄言超脑,被视为世界一流成果。可以说,李明在计算机的几个领域包括现代信息论、计算生物学、算法分析以及机器学习都做出了杰出贡献,称他是世界级专家一点不为过。

  在做这些基础性研究的时候,李明曾发现分析平均算法的复杂性。程序好还是坏,快还是慢,需要分析它的平均速度,这样的分析非常难,如果对每一个输入都去分析再加起来平均,工作量难以想象。而李明就发明了一种分析平均复杂度的新方法:如果能构造出一个有代表性的输入,只分析算法对这一个输入的时间复杂度,这就能代表大多数,也就有了所谓的平均复杂度。但这里有两个需要解决的问题,首先是有没有这样一个有代表性的输入,其二能不能找到。而李明就是利用“Kolmogorov复杂性”最终找到了这么一个有代表性的输入。使用这个方法,李明和他的同事解决了一系列计算机领域几十年没有解决的问题。

  当然,这些基础性的研究工作和创新,都是为多年后的“薄言”奠定基础。2006年,在加拿大的李明以敏锐的眼光洞察到了大数据的到来,他认为是时候做对话机器人了。虽然在当时,对话机器人并不流行。他联合清华大学的朱小燕教授组织了一个团队一起做项目和计划,并发表了重要论文,此时李明只有一个想法,“一定要把事情干起来!”

  然而研究人工智能并不是一件容易的事,其目的就是让计算机这样的机器能够像人一样”“思考”。其应用领域也很广泛,比如问题求解、逻辑推理与定理证明、智能信息检索技术,还有自然语言处理。自然语言的处理是人工智能技术应用于实际领域的典型范例,人类在这一领域已获得了大量可喜成果。计算机系统如何以主题和对话情境为基础,通过储备大量知识,生成和理解自然语言,这是一个极其复杂的编码和解码问题。“人类的高级智能,是从说话开始的。”李明说,“语言赋予了人们组织社会结构,思考和抽象的能力。因此,人工智能的革命,也应该从学习语言开始。”

  让机器人深入学习,需要一个“超脑”

  “采采芣苡,薄言采之。采采芣苡,薄言有之……”这是《诗经》里的一首诗,引申意为人们在大自然里辛勤愉快地劳作收获。

  要干成这样的“大事”,李明需要一个团队。在2013年,在国家政策扶持下,李明带领团队创建了宁波薄言信息技术有限公司。他们希望让全世界的用户和他们一起在机器人的深度自然语言理解上回归自然。李明介绍说,薄言团队的核心成员包括王靖波、熊琨、崔安颀、张泽峰。这个团队不同于其他团队,它是一个具有极强技术背景的人工智能团队,成员来自于康奈尔大学、哈佛大学、清华大学、北京大学、中科大少年班、滑铁卢大学以及国内外顶尖院校优秀毕业生。团队与加拿大滑铁卢大学、中国科学院计算所、清华大学等都有深入的高水平项目研发合作,并致力于自然语言处理研究及广泛应用。目前,团队已取得多项研究成果,包括语义理论、中英文问答系统等,被众多世界顶级学术期刊和学术会议收录。

  如何让机器来学习语言并深入思考?“深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。”沿着这条思路,经过10年的积淀和磨练,李明带领的薄言团队打造了薄言的“核心”——薄言超脑。薄言超脑是运行在大型GPU集群上的深度人工神经网络,拥有近十亿的神经元参数,能不间断地阅读互联网内容,组织结构和知识体系,已经积累了近2千万实体的知识网,3亿实体的语言表达,近百万领域专属知识,涵盖上千类别和中英文两种语言……薄言超脑在端到端对话生成、端到端问答(深层人工神经网络)的研究水平上,达到世界先进水平,其优势在于:扩展性强、持续积累中文语言理解语料和能力、迭代增长;系统的学习能力可形成长期壁垒,具有领先优势;信息距离理论及深度学习技术深度远超中文同类公司;定制化能力更适应AI产业市场需求。

  薄言豆豆:陪伴孩子的万能精灵

  终于,在薄言超脑这个平台上,2016年,薄言迎来了一个新成员——薄言豆豆(可以加微信公众号“薄言豆豆”来使用)。可以说,豆豆在目前世界上聊天机器人中是处于顶尖水平的。你问豆豆:“今天天气怎么怎么样?”它不但能准确告诉你今天的日期、温度、风力,更会给你提供出行意见以及穿衣指数等外延信息。聪明的豆豆不但知道今天天气情况如何,更知道明天、后天甚至大后天或用历史数据预测未来天气。

  曾有机构组织了一个测试,设计了1000个问题以测试国内多款聊天机器人的中文问答技术,最终结果是及格的只有豆豆一个。“其他有些机器人可能擅长对话而不关心知识。但是我觉得一个聊天机器人,只会简单对话肯定是不行的。你要想做好一个聊天机器人,就必须要有大量的知识做后盾。”李明说道,在薄言超脑这个平台,豆豆会通过读书、看报获取新的知识,并通过和人脑相似的多层神经网络,归纳新的概念以及他们之间的联系。可以说,薄言豆豆是一款以深度学习与神经网络为核心技术,语义理解能力领先的智能聊天机器人。

  人工智能的最初是关键词匹配的方式,到后来慢慢出现根据语序结构的模版来判断用户语言内容的手段;如今,横扫整个人工智能行业的深度学习被大量运用到对话机器人的训练中。李明说:“人工智能和自然语言处理的进步,首先一定要靠理论的进步,而不应该是工程上的关键字或模板匹配。”一个机器人能根据匹配和搜索关键字回答人类提出的一些问题,但这些工程的方法能力有限。“只有人工智能的理论不断发展,比如现在的深度学习,才能大大提高机器人的‘智能’”。

  “薄言豆豆”首先打破了关键字或模版匹配的传统方式,它不是一个工程而是一个科学,它基于的理论涉及物理、数学、计算机科学、哲学等学科领域。“薄言豆豆”以这些先进理论为基础能够自主学习,更新回答问题的内容。李明说:“我们还有一个置信神经网络,强化学习,调整对话逻辑,让豆豆变得更会说话。”

  如今,薄言豆豆已经能让暂时没有家长陪伴的孩子,通过豆豆一样可以实现对话、学习、成长。但这只是一个起步。“把薄言豆豆应用到医疗、智能家居、老年陪护、儿童陪护、给教师缺少的偏远山区做辅教??希望能对人们生活有用,给大家的生活带来方便,提高人们的幸福指数。”李明说。

  怀着美好愿景,十年磨一剑。李明带领团队用10年做好了一件事,坚守理论高地,力解人工智能60年没有解决的难题。而他最希望的是能跟大家一同见证中国人工智能语言交互处理科技走向世界,领导潮流,奉献社会。

  可爱的创业者,如果你或你的朋友的项目希望被云涌报道,请狠戳【这里】

云涌手机微页面

宣传合作请戳

园区宣传套餐 | 企业宣传套餐

云涌 创新创业媒体服务平台