新闻中心 NEWS CENTER
公司新闻
您现在的位置:首页 > 新闻中心 > 公司新闻
正泰线缆队伍成长中!

第二,多模态技术会使得信息的分发更加高效。多模态技术研究的三个难点:语义鸿沟、异构鸿沟、数据缺失

其实在目前来看,多模态研究难度还是非常高的。

其中大家谈得比较多的是语义鸿沟,虽然近十年来深度学习和大算力、大数据快速

再者,由于引入了多种模态的信息,所以怎样对不同模态之间的数据进行综合

另外,做语音、做图像是有很多数据集的,大家可以利用这些数据集进行刷分

下面我会分享我们在多模态这个方面所做的事情,以及这些技术是怎么样帮助快手平台获得更好的用户体验和反馈的。

多模态技术如何实现更好的记录

首先,多模态技术将实现更好的记录。随着智能手机的出现,每个人都可以用手机上摄像头去记录周围的世界,用麦克风去存储周围的音频信

我们希望整个记录过程是更加便捷、个性化、有趣,同时也是普惠的,具体我将分别通过四个案例分享。

1、语音转文字打造便捷字幕生成体验

一个视频里,音频部分对于整个视频的信息传递是非常重要的。网上有很多带

导语:这些科学家的研究领域包括信息挖掘、计算机视觉、语音技术、机器人、大数据挖掘、商业智能等,几乎囊括了ai领域从底层基础到认知、感知技术的全领域范畴。百

新成立的百度研究院顾问委员会包含5名成员,阵容星光熠熠,包括at&t和贝尔实验室前副总裁及首席科学家davidbelanger,伊利诺伊大学厄巴纳-香槟分校终身教授、计算机视觉领域顶级科学家davidforsyth,著名的计算语言学专家markli

百度高级副总裁、ai技术平台体系(aig)总负责人、百度研究院院长王海峰在现场发言中对各位顾问委员的加入表示热烈欢迎。他提到,学术研究一直是产业间ai核心竞争力的重要组成部分。此次新成立的顾问委员会将

发展数年来,百度研究院不仅汇聚了kennethwardchurch、吴华、李平、熊辉、杨睿刚、浣军、马艳军等国内外ai领域世界级专家,还在2018年陆续引入了自然语言理解、机器翻译领域专家黄亮,计算机视觉和生物特征领域专家

百度研究院顾问委员会成立大会上,新加入的顾问委员分别就当下最热门的ai研究领域进行了分享,并发表了自己的观点。

目前,百度研究院旗下共有深度学习实验室(idl)、大数据实验室(bdl)

会上,百度研究院还借此公布了近期在自然语言处理、语音、高性能计算、深

在自然语言处理(nlp)领域,百度构建了最大的中文异构知识图谱,研发基于

基于自然语言处理技术和语音技术,百度建立了世界上第一个具有集成预期和可控

导语:11月8日,acm公布2018年度杰出科学家名单,全球数据库领域领

acm是国际上历史最悠久、规模最大、最权威的计算机专业学会,著名的图灵

李飞飞,犹他大学计算机系终身正教授。曾获acm、ieee、visa、go

李飞飞教授于今年五月正式加盟阿里巴巴达摩院,带领团队投入到具有自主知

目前,李飞飞教授带领的阿里巴巴数据库事业部所研发的新一代分布

雷锋网ai科技评论借着这一契机,第一时间对他进行专访。采访中,李飞飞教授

(笑)怎么讲呢?我比较喜欢脚踏实地搞技术,一步一步。获得acm杰出科学家荣誉称号,当然还是非常高

从公司层面上说,加入阿里之后获得这个奖项可以帮助阿里、包括达摩院打造更好的技术品牌形象,往

您是什么时候开始对数据库研究产生兴趣?

读本科的时候。当时我上了一门课数据库课程,做了一个小项目,后面就用到了数据库系统,用了

在这些年的研究中,有什么心得体会可以与大家分享?

我在这些年的求学、教学经历中,以及与google、facebook、

导语:下周二,追一科技团队还将在雷锋网公开课上为大家带来分享~追一科技+

机器阅读理解(machinereadingcomprehension)

cmrc比赛与最流行的英文数据集squad形式类似,文档来源于中文维基百科,问题由人工撰写,根据给定的一篇文档和一个问题,参赛者需要解决的是,如何建立并训练model,使其能

数据在数据方面,主要工作集中在数据的归一化和去噪音。cmrc比赛训练集包

范廷颂是什么时候被任为主教的?

九广铁路小童储值票是何时停止使用的?

(1990年9月停止使用)

上面的数据样例展示了这种标注不一致问题,同样为时间点的询问,但是不同标注有后缀区别,这种标注不一致问题会使模型的最终预测em指标降低。

除了标注不一致的噪音,参赛队员还对文本进行了归一化,比如繁简转换,中英文标

模型在模型方面,追一此次参赛采用了经典的端对端阅读理解系统,整体框架参考微软的模型结构r-net,示意图如下:文本向量化表达

文本的向量化表达一直是深度学习系统效果的重中之重,本次参赛追一代表队使用了

英文elmo是基于字符级别的编码,对中文并不适用。针对中文文本追一团队实验了两套方案,第一版是采用词级别进行输入,第二版是将词改进为笔划级别的编码,两者都通过双层lstm变换来进行语言模型预训练。经过多

除elmo外,模型还加入了描述问题类型的onehot特征,即按提问方式将问

人工智能正文发私信给ai科技评论发送0

论文解读:对端到端语音识别网络的两种全新探索本文作者:ai科

雷锋网(公众号:雷锋网)ai科技评论按:语音识别技术历史悠久,早在上

在现在主流的利用深度学习的语音识别模型中仍在存在多种派系,一种是利用深度

第一种模型需要先实现hmm结构与语音的对齐,然后才能进一步地训练深度神经网络。除此之外,在训练这一类

上一篇: 拍照科普:DxOMark和手机拍 下一篇: 无