新闻中心 NEWS CENTER
公司新闻
您现在的位置:首页 > 新闻中心 > 公司新闻
正泰线缆队伍成长中!

与传统的检测数据集合相比,该赛事除了数据规模大、更真实之外,还存在一系列的挑战。具体来说,主要集中在以下三个方面:

数据分布不均衡:最少的类别框选只有14个,而最多的类别框选超过了140

漏标框:很多图片存在只标注主体类别,其他小物体或者非目标物体没有标注出来

尺度变化大:大部分物1以下,而有些框选却占了整个图片区域。如图所示,

网络为resnet-101的fastr-cnn,481,在测试阶段加

fasterr-cnn:采用这种框架可以达到略高于fastr-cn495。在测试阶段使用softnms以及multi-scaletestin525。

deformableconvolutionalnetworks:使用softnms以及multi-scaletesting策

deformablecascader-cnn:使用softnms以及multi-scaletesting策略前后__。

tombkeepervr新闻三星收购工控安全色情ipadkindlewin10兼容性体感枪同步科幻电影小牛改装长征五号直播a

iphoneandroidcopyright©20雷锋网-移动互联网智能

 腾讯ailab腾讯ailab腾讯ailab作为企业级ai

ai影响因子873高于100%的研究院

论文比赛开发活动更多相关论文报道更多论文报道emnlp2018|腾讯ailab解读16篇入选论文腾讯ailab第2次参加emnlp,共有16篇文章入选,涵盖语言理解、语言生成、机器翻译等多个研究主题。nips2018|腾讯ailab入选20篇论文,含2篇s

 开发12月近期活跃云从科技腾讯ailab得意音通最新开发报道开发云从科技ocr新突破:端到端的深度学习文本检测框架pixel-anchor通过特征共享的方式高效的把像素级别的图像语义分割和

导语:用ai辅助人工翻译提高效率和质量。腾讯ailab+2ai影响因子开发企业:腾讯操作:新产品内容:发布「腾讯辅助翻译」(transmart)雷锋网(公众号:雷锋网)ai科技评论按:11月13日,深圳-腾讯ailab发布

人机交互式机器翻译技术专门针对人工翻译过程,是人工智能辅助翻译系统的核心技术。与一般的机器翻译相比,人机交互式机器翻译的重要特征是允许用户实时干预译文生成,提供交互式机器翻译、翻译输入法、实时译文建议等高效交互

1、内核是国内第一个公开的交互式机器翻译的互联网落地产品;

2、搭载了业内第一个公开的融合机器翻译的辅助翻译输入法。该产品融合了

腾讯辅助翻译具体功能亮点如下:

首个公开的交互式机器翻译互联网落地产品,根据输入内容实时更新自动译文,显

首个融合机器翻译的辅助翻译输入法产品,比普通输入法更少的按键数,显著减少

比如翻译英文句子「janezhangbecamethefirstchi

基于自研的神经网络机器翻译引擎,提供灵活、准确的实时译文片断智能推荐,并

导语:通过特征共享的方式高效的把像素级别的图像语义分割和锚检测回归放

随着深度学习的发展,在ocr的文本检测领域中,也涌现出一系列

基于像素分割的文本检测框架首先通过图像语义分割获得可能的文本像素,之后通

基于像素分割的文本检测往往具有更好的精确度,但是对于小尺度的文本,因为适用的文本像素过于稀疏,检

针对这些问题,云从科技提出了一种端到端的深度学习文本检测框架pixel-anchor,通过

此外,对于如中文这样文本长度跨度很大的语言,在pixel-anchor中,

导语:超过阿里、百度、约翰霍普金斯大学等企业及高校~云从科技+8ai影响因子活动企业:

将 librispeech数据集上的错词97%librispe

云从科技在librispeech数据集上将错词率(worderror

云从科技此次推出的语音识别模型pyramidal-fsmn融合图像识别与

语音识别技术近年进展2017年3月,ibm结合了lstm模型和带有3个

2017年8月,微软发布新的里程碑,通过改进微软语音识别系统中基于神经网络的听觉和语言模型,在去年基础上降低了大约12%1%,声称超过专业速记员。相对9%,声称超过人类。

2017年12月,谷歌发布全新端到端语音识别系统(state-of-th

2018年6月,阿里巴巴达摩院推出了新一代语音识别模型dfsmn,将全

2018年10月,云从科技发布全新pyramidal-fsmn语音识别模

pyramidal-fsmn语音识别模型原理解析云从科技提出的新型网络结构,能更

模型设计采用一种残差卷积网络和金字塔记忆模块的序列记忆网络相结合的结构; 

训练方式使用lattice-free最大互信息(lattice-freem

解码部分采取rnnlmrescoring的方式,利用rnn提取一个句子中的长期语义信息,从而更有效地帮助声学模型得到准确的句子。

如下图所示,作者采用了由6层residualcnn和10层pyramida

导语:本文将介绍「tencentml-images」项目正式开源情况。腾讯ailab+4ai影响因子开发企业:腾讯操作:开源数据集内容:多标签图像数据集雷锋网ai科技评论按:10月18日,腾讯ailab

/tencent/tencent-ml-images

据雷锋网(公众号:雷锋网)ai科技评论了解,腾讯ailab此次公布的图像

本次正式开源,其主要内容包括:

ml-images数据集的全部图像urls,以及相应的类别标注。因原

ml-images数据集的详细介绍。包括图像来源、图像数量、类别数量、类

完整的代码和模型。腾讯ailab提供的代码涵盖从图像下载和图像预处理,到基于ml-images的预训

上一篇: WP的逆袭6sPlus/Lumi 下一篇: 无