YouTube玩转的自动字幕,为什么被国内视频网站“主动错过”?

访客4年前关于黑客接单983

在2017年初,YouTube已经为10亿条视频提供了自动添加字幕的服务,使用者每天的播放次数超过 1500 万次。那么这一自动字幕的功能为何没有被我们国内的视频网站“Copy”?

YouTube玩转的自动字幕,为什么被国内视频网站“主动错过”?

成为中国YouTube,这估计是每一家国内视频网站都曾经设想过的目标。现在,无论是从全球市场规模、还是从营收规模上来说,YouTube都已经是一个庞然大物。而在国内,至今已难以找到一家能够与YouTube实力相当,甚至说模式相似的视频网站了。

差异是如何产生的,已经成为一个可以写成商业专著的选题了。而这一次我们则关心一个更为细节的产品技术问题,那就是在YouTube上早已实现的自动字幕功能,为何没有在国内的主流的视频网站上出现?

据报道,在2017年初,以UGC起家的YouTube已经为10亿条视频提供了自动添加字幕的服务,使用者每天的播放次数超过 1500 万次,而且目前已支持全球10种语言的自动字幕加载,以及支持包括简体中文在内的上百种语言的机器翻译。那么这一自动字幕的功能为何没有被我们国内的视频网站“Copy”?

也许你之一反应会想到技术原因。也是也不全是。毕竟近几年,我国在自动语言识别上面的技术早已成熟,在视频网站上应用也许早已不成问题。

“是不为也,非不能也。”如果孟老夫子在世,可能还会说出这句话来。但原因究竟是啥,恐怕还是要继续追问下去,而最终我们其实还是想对这些国内视频网站的新老玩家们提问下:这么“香”的技术,到底要不要学习一下呢?

自动字幕:从Goodness到Business

YouTube的自动字幕功能是在2009年由谷歌的工程师们开发的,那时离谷歌收购YouTube已经过去三年了。这一功能的初衷是,通过将视频声音转化成文字字幕,为全世界有听力障碍的用户提供便利。而开发这一功能的软件工程师肯·海伦斯坦也正是一位聋哑人士。

众所周知,YouTube是从用户UGC视频内容起家的,目前仍然是全球更大的UGC视频网站。当前月用户访问数可以达到18亿,用户每分钟上传视频时长达到400小时,并且时长还在增长。

这同时意味着,有大量上传的UGC视频中是没有主动添加字幕的。这对于正常听力的用户来说,并没有什么影响,而对于有听力障碍的人来说,则相当于缺少了极其重要的音频信息。

而自动字幕的加入,则在一定程度上帮助了听障用户获取更多的信息渠道。

目前,谷歌和YouTube团队正在利用机器学习为自动字幕增加音效信息,从而更大程度地丰富音频内容的表达。通过添加如 *** 、狗叫声、敲门声等音效字幕,也正是出于改善聋哑或听障人士的观看体验而进行的技术改进。

这样一项出于社会责任感和用户公平体验的技术,也带来了额外的市场推广价值。

YouTube玩转的自动字幕,为什么被国内视频网站“主动错过”?

随着自动字幕可以识别的语种的增加,以及自动翻译功能的加入,这一项技术成为一项全球用户都可以受益的功能。比如,大量优质的英语原声知识分享视频可以通过自动添加英语字幕,再转为其他语种,供非英语区的用户观看学习。这显然对YouTube的全球化推广产生了积极的推动作用。

在每天上千万次的自动字幕的使用中,语音识别难免会出现一定错误。但随着YouTube社区用户对这些自动字幕信息进行评论和编辑后,这些信息又会再进入机器学习的流程,从而帮助自动字幕系统更好地提高准确率。同时,自动字幕及机器翻译准确度的提升,又推动内容推荐的精准度的提升,进一步增加用户粘性和使用时长。

一项帮助提升用户体验的AI技术,又在用户的海量数据的帮助下变得更加强大,很好地印证了“科技向善”可以带来更多意想不到的好处。

当然,这里有一点比较遗憾的地方是,如果你有机会使用YouTube的中文简体的自动翻译功能的时候,你可能并不好理解翻译出来的中文到底在表达什么意思?

一来,可能视频中中文口语化的音频内容确实不好翻译;二来,由于你懂得的原因,这个自动翻译的数据模型并没有得到有效的训练。

那么,自动字幕如此得天独厚的市场空白、如此巨大的应用规模,以及如此现成的技术条件,为什么没有国内的视频网站主动去使用呢?

为什么国内视频网站们“主动”错过这一技术?

相关文章

数据分析三大手法之“细分分析”

数据分析三大手法之“细分分析”

在事情中,我们经常需要阐明各类数据。差异的数据阐明要领要怎么用呢?本文作者按照本身的自身经验,从四个角度举办阐明先容,推荐给对数据阐明感乐趣的童鞋阅读。 作为业务部分的数据阐明师,常常面对的场景就是...

新经济形态下, 为什么要重视「服务营销」

新经济形态下, 为什么要重视「服务营销」

处事营销是一门独立且严谨的学科,无法通过一篇文章全面的叙述其全部。这篇文章的目标在于唤起营销人在新的经济形态下对付处事营销的认知和重视,它的合用性不只在处事行业,更是在产物同质化和消费进级的趋势下,可...

流量最大化销量,这5大问题必须解决

流量最大化销量,这5大问题必须解决

这篇内容,我们来聊聊如何通过内容晋升流量的转化率。重点分享实现从流量最大化到销量,在流传内容上必需办理的5大问题。 “流量焦急症”,好像让各人过于重视如何去挖掘流量洼地、去给本身品牌争取大曝光、去给...

下厨房商业化探索(上):KOL出圈记

下厨房商业化探索(上):KOL出圈记

从美食KOL带货,到品牌入驻电商化,到知名厨神直播授课,我们都可以看到,下厨房不再是那个以UGC(用户生产内容)分享美食为单一资本的内容平台了,它的杀手锏越来越丰富,也初具成效。下厨房系列将分为三个部...

操盘经验分享:如何从零全方位搭建线上运营体系?

操盘经验分享:如何从零全方位搭建线上运营体系?

运营体系分为运营思维模型和运营实操方法论,下面将从这两个大的层面进行分享说明,内容来源于自己工作、学习经验,仅供参考。 运营九字方针 视觉锤:形成品牌视觉定式,如洋河蓝色经典,加多宝、可口可乐、Wi...

如何处理网络产品对用户影响力的治理问题?

如何处理网络产品对用户影响力的治理问题?

编辑导读:现如今,网络产物已经遍布糊口的方方面面。人们越来越明明地感受到留意力不绝被分手,这种延伸出来的影响力是实现互联网安详和全球化成长必需要思量的问题。本文将从四个方面,对这个问题展开阐明,但愿对...